Információ elektronika, 1970 (5. évfolyam, 1-4. szám)

1970 / 3. szám

kód ismeretében mindig kiszámítható az értéke. Ezért elegendő vagy a k, vagy az (im ... 124) helyértékes jelsorozat tárolása. A számítógépek többségében a memóriarekeszek fizikai elhelyezésüknél fogva automatikusan biztosítják a cím szerinti azonosíthatóságot, s ezért a memóriarekeszek címét nem kell külön rekeszben tárolni. Ebből következik, hogy a bázisregiszter tartalmának (kezdőcím), valamint a leképzésnek szükséges információk ismeretében keresés nélkül a leképzés algoritmussal meghatározhatjuk bármely utasítás konkrét címét vagy címeit. A vállalati szociológiai és statisztikai felméréseknél viszonylag közepes nagyságú (500-5000) mintavétellel számolhatunk. Ahhoz, hogy méréseink megfelelő megbízhatósággal reprezentálják a sokaságot, csak kivételes felméréseknél fordulhat elő olyan vizsgálat, amelynél az előfordulható esetek száma a két- háromezret meghaladja. Ebből azt a következtetést vonhatjuk le, hogy ilyen statisztikai táblák rendezés nélküli gyűjtéséhez (a leképzési szabályok ismeretében) kb. 2—3000, konkrét programjainknál 5000 szó közvetlen elérésű szabad tárolókapacitás szükséges. Ily módon a kívánt táblázatokat az adatfile egyszeri beolvasásával közvetlen indexes dekódolással gyűjthetjük. Abban az esetben, ha a tábla nem használná fel a gyűjtésre szabadon hagyott tárolómezőt, akkor célszerű egyszerre több táblán gyűjteni. Amennyiben a tábla nagysága meghaladná a gyűjtőmező nagyságát, szegmentáláshoz kell folyamodni. A szegmentálásra fordított idő bőven megtérül a rendezés kiküszöböléséből adódott időmegtakarításból. A többszörös indexek egyszeres indexszé való lebontásával lehetőség nyílik több dimenziójú táblák együttes gyűjtésére. A gazdaságos memóriakihasználás céljából a változók részére fenntartott memóriaterület dinamikusan osztandó fel. Azok a korlátok, amelyeket az általános programok definiálásánál megadtunk, csak szervezési, illetve elvi korlátok. A programok a paraméterektől függően bármilyen 2500-nál kisebb rekordhosszal dolgozhatnak és könnyen átalakíthatók változó rekordhosszú változatra is. A kombinációs táblázó program (amelynek egyszerű esete az egyszerű táblázó program) a következő információs táblákkal rendelkezik: TI — a feldolgozás törzsadatai: a) a rekord hossza b) hány táblát gyűjtünk az adott menetben c) hol kezdődnek a rekord törzsadatai d) hol kezdődnek a táblák információi T2 - a rekord törzsadatai rekordelemenként: a) az adott elem kódjának minimális értéke b) a feldolgozás fázisától függően vagy az adott elem kódjának maximális értékét, vagy a maximális és a minimális kódkülönbséget tartalmazza T3 — a táblák információs táblánként: a) a tábla kódja b) hány dimenziós az adott tábla c) a gyűjtés típusa d) a kiírás módja e) a gyűjtőmezőben hol kezdődik a tábla 0 a gyűjtés tárgyát képező elem kódja (a gyakoriság esetében nulla) g) a gyűjtés kódjai T4 - gyűjtőmező. A feldolgozás algoritmusa a következő: — Első lépésként a program beolvassa a feldolgozáshoz szükséges paramétereket, és ennek alapján kitölti a T1, T2, T3 táblákat. — A második lépésben beolvassa a rendezetlen adatfile-t és rekordonként, táblánként elvégzi a gyűjtés kódjai szerint a gyűjtés tárgyát képező elemnek gyűjtéstípus szerinti gyűjtését. — A harmadik lépésbenaz egész adatfile beolvasása után) a kiírás módjának megfelelően, táblánként megtörténik a kiírás. A kiírás történhet lyukszalagra, mágnesszalagra (karakteres formában) vagy numerikus gyorsnyomtatón. A feldolgozás sebessége az adatfile nagyságától, a táblák számától és a kiírás módjától függ. A MINSZK—2 számítógépen 100 000 szavas adatfile-ból 108 féle 1-től 5 dimenziós tábla készítése a gyakoriság és a százalékos megoszlás kiírásával kb. 25—30 perc, amelyből a számolás 7 perc, a többi időt a FACIT lyukasztón való lyukasztás vette igénybe. Irodalom [1] YULE, G. V.-KENDALL, M. G.: Bevezetés a statisztika elméletébe. Budapest, 1964. Közgazdasági és Jogi Könyvkiadó. [2] HAJTMAN BÉLA: Bevezetés a matematikai statisztikába — pszichológusok számára. Budapest, 1968. Akadémiai Kiadó. [3] CSEH-SZOMBATHY L. - FERGE ZS.: A szociológiai felvétel módszerei. Budapest, 1968. Közgazdasági és Jogi Könyvkiadó. [4] NYÍRY GÉZA: Adatrendezés elektronikus számítógépen. Információ-Elektronika, 1969. 1. sz. [5] LAKY T.: Számítástechnika alkalmazásának lehetőségei a szociológiai vizsgálatokban. INFELOR belső tanulmány. [6] MOSER, C. A.: Survey Methods in Social Investigation. (Adatfelvételi módszerek a társadalomvizsgálatoknál.) London, 1958. William Heinemann Ltd. [7] VENTCEL, E. SZ.: Teória verojatnosztej. Moszkva, 1964. Nauka. [8] BOJARSZKIJ, A. J. szerk.: Sztatisztika i elektronnovacsiszlitel’naja technika v ekonomike. Moszkva, 1968. [9] KOROLJEV, M. A.: Obrabotka ekonomicseszkoj informacii na elektronnüh masinah (teoreticseszkie voproszü). Moszkva, 1965. Ekonomika. РЕЗЮМЕ Статья содержит описание системы программ ориентированной на систему, разработанной для ЭВМ Минск - 2/22/ для обработки социологических статистических данных. Описание кроме определения системы подробно занимается основным алгоритмом сбора данных без предшествующей сортировки. SUMMARY For the processing of sociological and statistical data, the article presents a programme system oriented for MINSZK-2 computer. Outside a definition of the system, the description offers a detailed account of basic algorythm for data collecting without previous sorting.