лучшие книги по экономике
Главная страница

Главная

Замовити роботу

Последние поступления

Форум

Создай свою тему

Карта сайта

Обратная связь

Статьи партнёров


Замовити роботу
Книги по
алфавиту

Б
В
Г
Д
Е
Ж
З
И
К
Л
М
Н
О

Основи інформаційних систем

Страницы [ 1 ] [ 2 ] [ 3 ] [ 4 ] [ 5 ] [ 6 ] [ 7 ] [ 8 ] [ 9 ] [ 10 ] [ 11 ] [ 12 ] [ 13 ] [ 14 ] [ 15 ]
[ 16 ] [ 17 ] [ 18 ] [ 19 ] [ 20 ] [ 21 ] [ 22 ] [ 23 ] [ 24 ] [ 25 ] [ 26 ] [ 27 ] [ 28 ] [ 29 ] [ 30 ] [ 31 ] [ 32 ]
[ 33 ] [ 34 ] [ 35 ] [ 36 ] [ 37 ] [ 38 ] [ 39 ] [ 40 ] [ 41 ] [ 42 ] [ 43 ] [ 44 ] [ 45 ] [ 46 ] [ 47 ] [ 48 ] [ 49 ] [ 50 ]

4.2. Методи класифікації економічної інформації

Система класифікації визначається і характеризується використаним методом класифікації, ознаками класифікації (покла­деними в основу виділення класифікаційних угруповань), їх послідовністю і кількістю рівнів (ступенів) класифікації, а також кіль­кістю угруповань (ємність). Загалом ознака класифікації — це властивість об’єкта класифікованої множини. Ознаки класифікації мо­жуть мати кількісне (стаж, оклад, вік) або якісне (професія, посада, галузь) значення. Кількість значень ознаки класифікації визначає кількість класифікаційних угруповань, які можуть бути створені при розподілі множини об’єктів за цією ознакою.
Розрізняють два основних методи класифікації:
1) ієрархічний,
2) фасетний.
Метод класифікації — це по суті сукупність правил створення системи класифікаційних угруповань і їх зв’язки між собою.
Iєрархічний метод класифікації характеризується тим, що початкова множина об’єктів техніко-економічної інформації послі­довно поділяється на угруповання (класи) першого рівня поділу, далі — на угруповання наступного рівня і т.ін.
Сукупність угруповань утворює при цьому ієрархічну деревоподібну структуру, яку часто зображають у вигляді розгалуженого (гіллястого) графа; вузлами цього графа є угруповання, як це показано на рис. 13.
На цьому рисунку початкова множина С поділяється на пер­шому рівні (ступені) на m угруповань першого рівня (С1, С 2, ... Сm).

Рис. 13. Схема угруповань ієрархічного методу класифікації
Потім кожне угруповання поділяється на угруповання наступного рівня і т.д. Так, угруповання С1 поділяється на n угруповань другого рівня (С11, С12, ... С1n), а угруповання С11 на р уг­руповань третього рівня (С111, С112, ... С11р) і т.п. Кількість рів­нів ступенів класифікації визначає глибину класифікації. Загалом кожне угруповання може поділятися на угруповання нижчого рів­ня з використанням своєї ознаки; глибина класифікації у кожній гілці ієрархічної структури може бути різною.
В ієрархічній класифікації в частинному випадку на кожному рівні поділу може бути використана одна ознака. Це означає, що об’єкти початкової множини характеризуються однаковим набором ознак.
При використанні ієрархічного методу класифікації для від­несення конкретного об’єкта класифікації на кожному ступені лише до одного класифікаційного угруповання необхідно додержувати таких основних правил:
поділ кожного угруповання виконується лише за однією ос­новою поділу;
здобуті на кожному рівні класифікації угруповання не повин­ні повторюватися;
класифікації мають виконуватися так, аби сума частин становила множину, яку поділили.
Найбільш суттєвими і складними питаннями, що постають при використанні ієрархічного методу класифікації, є вибір системи ознак, що стануть основою поділу, а також їх послідовність.
Вибрані ознаки мають бути визначальними в розв’язуванні конкретних техніко-економічних задач, для яких створюється ця система класифікації. При цьому формовані в угрупованні об’єкти повинні мати найбільшу кількість однакових ознак. Вибір послі­довності ознак залежить передусім від характеру техніко-еко­но­мічної інформації. В інформації з природним розміщенням ознак це не становить труднощів. Наприклад, в інформації про органи управління, територіально-адміністративний поділ і т.ін. послі­довність ознак відповідає ієрархії підпорядкованості об’єктів. При застосуванні ієрархічного методу класифікації для об’єктів з не­залежними ознаками (наприклад, кадрів, продукції тощо) вибір послідовності ознак залежить від статистичних характеристик частоти та ймовірності звертання до тієї чи іншої ознаки (най­частішим звертанням мають відповідати вищі рівні класифікації).
Iєрархічний метод класифікації характеризується кількістю рівнів (ступенів) класифікації, глибиною, ємністю і гнучкістю. Кількість рівнів визначає глибину класифікації, яка встановлюєть­ся залежно від міри необхідної конкретизації угруповань і кіль­кості ознак, які беруть участь у розв’язуванні відповідних задач.
Від глибини класифікації та кількості створених на кожному рівні угруповань залежить ємність. Як правило, найбільша кіль­кість послідовних угруповань, на які може поділятися попереднє угруповання на кожному рівні класифікації, встановлюють сталим або для всієї класифікації, або для даного рівня.
Застосування ієрархічного методу класифікації пояснюється його доброю пристосованістю ручної обробки, звичністю, великою інформативністю кодів, які несуть змістове навантаження.
Проте цей метод класифікації має ряд недоліків, які іноді утруднюють його використання. Це передусім жорсткість структури, яка зумовлена фіксованістю ознак і їхньою послі­довністю. Через це зміна хоча б однієї ознаки призводить до перерозподілу класи­фі­каційних угруповань. Тому в класифікаторах, побудованих за ієрар­хічним методом, мають передбачатися значні резервні ємнос­ті. Крім того, ієрархічний метод класифікації не дає змоги агрегувати об’єкти за будь-яким раніше не передбаченим довільним поєднанням ознак, а також у деяких випадках ускладнює автоматизовану обробку, оскільки утворюється нестандартний розподіл послідовності ознак.
Перелічені недоліки ієрархічного методу класифікації компен­суються фасетним методом, при якому початкова множина об’єктів може незалежно поділятися на класифікаційні угруповання щоразу з використанням однієї з обраних ознак.
Кожна ознака фасетної класифікації відповідає фасеті, що являє собою список значень найменованої ознаки класифікації. Наприклад, ознака «колір» містить такий список значень: червоний, білий, чорний, блакитний ... зелений; ознака — «професія» містить такий список значень: апаратник, автослюсар ... токар і т.ін. Отже, система класифікації може бути подана переліком незалежних фасетів (списків), які містять значення ознак класи­фі­кації. Множинне описання об’єктів техніко-економічної інформа­ції відбувається в кожній конкретній задачі на основі задання фасетної формули, яка утворюється з послідовності ознак класи­фікації, використовуваних у задачі. Кількість фасетних формул визначається можливим поєднанням ознак. Для кожної фасетної формули може бути утворена ієрархічна класифікація, в якій на кожному рівні поділу використовується одна ознака, що відпо­ві­дає окремій фасеті, а послідовність ознак визначається фасетною формулою.
Розглянемо як гіпотетичний приклад фасетну класифікацію одягу в разі використання трьох ознак (фасетів): вид тканини, сезонність, призначення (рис. 14).
З використанням цих трьох ознак шляхом переставлення їх послідовності можна побудувати шість різних ієрархічних класифікацій (з трьома рівнями розподілу). Один приклад наведено на рис. 15.
Для цього прикладу одержаної ієрархічної класифікації три угруповання нижчого рівня містять відповідно такий одяг:
1) чоловічий, зимовий, вовняний;
2) жіночий, зимовий, вовняний;
3) дитячий, зимовий, вовняний.

Рис. 14. Фасети ознак і їх значення

Рис. 15. Можливий варіант ієрархічної класифікації для заданої
послідовності фасетів
Якщо використати номери фасетів, наведених на рис. 14, то поданій на рис. 14 ієрархічній класифікації відповідає фасетна формула: 1—2—3, яка відображує склад і послідовність ознак роз­поділу.
Крім наведених схем класифікації ці три ознаки дають змогу створити ще три схеми з використанням однієї ознаки і шість схем класифікації з використанням двох ознак.
Отже, будь-яке угруповання у системі класифікації визнача­ється набором значень ознак об’єктів класифікації (може бути одна або кілька ознак). Оскільки, як легко помітити з прикладу, наве­деного на рис. 15, кількість можливих класифікацій швидко зрос­тає зі зростанням кількості незалежних ознак, у ряді випадків краще мати перелік окремих фасетів — ознак; будь-яка комбінація фасетів визначає одну ієрархічну класифікацію, кожне угруповання якої визначається комбінацією значень ознак. Загалом вся множина об’єктів класифікації може описуватися досить великою кількістю дескрипторів, які відповідають значенням різних ознак множини об’єктів. Кожний об’єкт може описуватись якоюсь части­ною цих значень. Очевидно, що будь-яка комбінація дескрипто­рів зі словника-тезауруса, який описує розглядувану множину, визначає можливий клас об’єктів. Цей клас містить певні частини об’єктів; у деяких випадках ця частина може бути по­рож­ньою.
При застосуванні фасетного методу класифікації слід додержувати таких основних правил:
ознаки, які використовуються в різних фасетах, не повинні повторюватися (принцип взаємного виключення фасетів);
із усіляких ознак, які характеризують множину об’єктів класифікації, відбираються і фіксуються лише істотні, які забезпечують розв’язування конкретних економічних задач.
Фасетний метод класифікації не має недоліків ієрархічного методу. Він особливо ефективний при функціонуванні комп’ю­терних інформаційних систем.

4.3. Методи кодування економічної інформації

Методи кодування техніко-економічної інформації, які використовуються при створенні класифікаторів, безпосередньо пов’я­зані з методами класифікації.
Кодування призначене для формалізованого опису семантики (назв) різноманітних аспектів даних, які використовуються в уп­равлінні народним господарством, найчастіше у вигляді цифрових кодів. Таке подання найприйнятніше для підвищення ефективності автоматизованої обробки економічної інформації.
Під кодуванням загалом розуміють процес позначення первинної множини об’єктів або повідомлень набором символів заданого алфавіту на основі сукупності певних правил. Залежно від використаних символів розрізняють цифрові, буквено-цифрові та буквені коди. Кількість символів у алфавіті називають основою коду. Залежно від основи коду вони бувають двійкові, десяткові, шістнадцяткові і т.ін. Залежно від використаних правил кодування коди можуть бути змінної чи постійної довжини. Основною вимогою, яку ставлять до кодування, є однозначне подання кожного об’єкта кодованої множини, тобто кожному об’єкту множини має відповідати єдиний код.
Системою кодування називають сукупність методів і правил позначення об’єктів заданої множини. Система кодування характеризується ємністю — кількістю кодів, що різняться між собою, тобто комбінацій, використаним алфавітом коду і правилами утворення коду.
Для сталого коду на всі сполучення ємність дорівнює Е = а r (а — кількість символів у алфавіті коду, r — розрядність коду). Отже, у разі використання десяткового коду, коли обсяг кодованої множини не перевищує 10, достатньо використати один десяток (розряд), а коли не перевищує 100 — двох розрядів і т.д.
Код характеризується довжиною, тобто кількістю використаних розрядів, структурою, яка відображає зміст окремих розрядів або груп розрядів коду.
У процесі кодування намагаються вирішити дві основні проб­леми — забезпечити ефективність і надійність переробки інфор­мації. Якщо вирішення першої проблеми найчастіше пов’язане з намаганням зменшити довжину коду, то при вирішенні другої доводиться вводити ту чи іншу інформаційну надмірність. Тому ком­плексне вирішення пов’язане з пошуком певного оптимуму.
У процесі кодування економічної інформації необхідно роз­в’язати три основні задачі: однозначного позначення (інден­ти­фікації) кожного об’єкта заданої множини, кодування деякої сукупності властивостей (атрибутів) об’єкта і забезпечення інформа­ційної надійності або достовірності на всіх етапах кодування, передачі, зберігання і переробки даних.
Зрештою код будь-якого об’єкта (запис інформації про об’єкт) загалом складається з ідентифікаційної частини, інформа­ційного блока, який містить набір кодів, що відповідають властивостям да­ного об’єкта, і додаткових розрядів або блоків, які забезпечують захист усього коду від можливих помилок. Прикладом об’єктів з набором характеристик можуть слугувати титульні списки будов, паспорти територій, підприємств тощо. Їх атрибутами є галузі, міністерства, адміністративні райони і т.ін., які кодуються за допомогою відповідних класифікаторів.
Найпростішим і найпоширенішим методом кодування об’єк­тів первинної множини є порядковий метод. При використанні цього методу кожний об’єкт класифікованої множини кодується за допомогою поточного номера. Порядковий метод застосовуєть­ся при кодуванні одноознакових, сталих та малозначних номенклатур, наприклад, категорії персоналу, статті витрат, види плате­жів до бюджету тощо. Порядковий метод кодування дуже простий для ідентифікації. Але суттєвим недоліком даного методу є від­сут­ність у коді будь-якої інформації про об’єкт і відносна складність автоматичної обробки інформації при підбитті підсумків за групами об’єктів.
Притаманні порядковому методу кодування недоліки деякою мірою усунуті в серійно-порядковому методі кодування.
Метод характеризується тим, що первинна множина поділя­ється на кілька частин (згідно з деякою ознакою) і для кодування об’єктів кожної частини призначається серія номерів (кодів). Об’єкти кодуються порядковим номером у межах відведених для них серій.
Цей метод кодування використовується для об’єктів, які ма­ють дві ознаки. Можна припустити, що при такому кодуванні використовується змінний алфавіт коду. Наприклад, з номера 1-го по 5-й закодовано одну частину об’єктів, з 6-го по 15-й — другу, з 16-го по 25-й — третю і т.д.
При кодуванні сукупності властивостей об’єктів, тобто при створенні інформаційного блока, рекомендують застосовувати два основних методи створення коду: послідовного кодування на основі використання ієрархічної класифікації і паралельного кодування на основі фасетної класифікації.
При використанні фасетної класифікації кожне угруповання системи класифікації відповідає деякій сукупності значень властивостей об’єктів. При цьому кожне угруповання першого рівня поділу відповідає одному значенню, другого — значенню двох властивостей і т.ін. У кожній гілці ієрархічної класифікації, як правило, використовується своя сукупність властивостей. Значення властивості, записаної на певному розряді коду у вигляді цифр (групи цифр), залежить при цьому від значення цифр на попередніх розрядах (десятках).
Якщо розглядати структуру кодової комбінації в разі послі­довного кодування, слід зазначити, що код угруповання створю­ється на основі коду угруповання попереднього рівня додаванням до нього ще одного розряду (або групи розрядів). Так, якщо в ієрархічній класифікації використовується послідовність угруповань під назвами «клас», «підклас», «група», «підгрупа» і на кожному рівні розподілу може бути до десяти номенклатур, то для позначення класу можна використати одну цифру, для підкласу — дві і т.д. (рис. 16).
При використанні послідовного методу логічно будується код (кодова комбінація), який має велику інформативність. Але код при цьому дуже громіздкий і складної сртуктури. Через негнучкість послідовного  методу  кодування  його доцільно  використовувати



Рис. 17. Паралельний метод кодування

лише в тих випадках, коли техніко-економічна інформація зміню­ється у незначних розмірах або зовсім не змінюється протягом три­валого часу використання класифікаторів. Метод широко за­сто­совується при розробці загальнодержавних класифікаторів продукції, галузей і т.ін.



 Рис. 16. Послідовний метод класифікації
(Х — цифровий розряд коду)

Якщо для позначення кожної окремої ознаки незалежно використовується один або кілька розрядів коду, то такий метод кодування сукупності властивостей називають паралельним, а інак­ше — незалежним, або фасетним.
Структура коду сукупності властивостей при паралельному методі відповідає фасетній формулі. На рис. 17 подано код класи­фікаційного угруповання, яке об’єднує об’єкти, що характеризуються чотирма властивостями.
Як видно з рис. 17, значення кожної властивості кодується не­­залежно, а послідовність властивостей визначається конкретною фасетною формулою (1—2—3—4), код 040109502.
При застосуванні паралельного методу кодування на про­тива­гу послідовному значенню ознаки, записане на будь-якому роз­ря­ді коду, не залежить від значень ознак, записаних на інших роз­ря­дах. Це дає змогу за конкретним кодом легко дізнатись, набором яких ознак описується розглядуваний об’єкт. Найчастіше оз­нака задається у вигляді кодової таблиці.
Паралельний метод кодування дає багатоаспектну класифі­кацію. Вона добре пристосована для машинної обробки і роз­в’язання різних економічних задач. Блокова побудова коду за фа­сетами спрощує його стандартизацію. До недоліків цього методу кодування належить менша порівняно з послідовним методом інформативність і ємність, що пояснюється неповним викорис­танням останньої.
При виборі методу кодування слід пам’ятати, що цей метод має забезпечувати:
у межах заданої множини однозначне визначення об’єкта;
необхідну інформацію про об’єкт;
використання як алфавіту коду десяткової цифри і літер ук­раїнської абетки, що зручно для машинної обробки і обробки людиною;
по змозі найменшу довжину коду, що спрощує заповнення до­кументів, спрощує їх перевірку, зменшує кількість помилок, роз­міри машинної пам’яті і час обробки;
достатній резерв незайнятих кодів, щоб можна було кодувати нові об’єкти й угруповання, не порушуючи структури класи­фікатора;
можливість автоматичного контролю помилок, наприклад, вне­сенням до коду контрольного розряду.

Страницы [ 1 ] [ 2 ] [ 3 ] [ 4 ] [ 5 ] [ 6 ] [ 7 ] [ 8 ] [ 9 ] [ 10 ] [ 11 ] [ 12 ] [ 13 ] [ 14 ] [ 15 ]
[ 16 ] [ 17 ] [ 18 ] [ 19 ] [ 20 ] [ 21 ] [ 22 ] [ 23 ] [ 24 ] [ 25 ] [ 26 ] [ 27 ] [ 28 ] [ 29 ] [ 30 ] [ 31 ] [ 32 ]
[ 33 ] [ 34 ] [ 35 ] [ 36 ] [ 37 ] [ 38 ] [ 39 ] [ 40 ] [ 41 ] [ 42 ] [ 43 ] [ 44 ] [ 45 ] [ 46 ] [ 47 ] [ 48 ] [ 49 ] [ 50 ]


ВНИМАНИЕ! Содержимое сайта предназначено исключительно для ознакомления, без целей коммерческого использования. Все права принадлежат их законным правообладателям. Любое использование возможно лишь с согласия законных правообладателей. Администрация сайта не несет ответственности за возможный вред и/или убытки, возникшие или полученные в связи с использованием содержимого сайта.
© 2007-2022 BPK Group.