Офисные информационные системы

       

Технология работы систем EDMS первого поколения




Суть индексирования по ключевым словам (или атрибутного индексирования) заключается в
том, что для каждого вводимого или сохраняемого документа заполняются соответствующие
поля в индексном файле. Заполнение осуществляется как вручную, так и с помощью программы,
которая по какому-либо признаку выделяет в документе значения ключей/атрибутов.
Серьезные ограничения при использовании этих систем связаны со следующими
обстоятельствами:

  • Определение ключевых слов - достаточно субъективный процесс; даже при
    участии самого независимого эксперта трудно избежать одностороннего влияния
    и субъективности при выборе ключевых слов.
  • Определение ключевых слов - достаточно дорогостоящая процедура (по
    оценкам AIIM** составляет от $5 до $20 на документ) из-за невозможности
    автоматической индексации и низкой производительности при определении
    ключевых слов вручную.
  • Предполагается, что пользователи будут осуществлять поиск информации
    предсказуемым способом, т.е. по тем ключевым словам, которые были
    заложены.
  • Поиск по ключевым словам - это четкий поиск, т.е. пользователь должен
    знать в точности то, что он ищет. Если сделана ошибка при написании ключевого
    слова в запросе для поиска, система никогда не найдет нужную информацию.
  • Ключевые слова могут меняться со временем, т.е. понятия, которые были
    "ключевыми" вчера, вовсе не необязательно будут столь же важны через
    год.

Технология работы с системами EDMS второго поколения представлена на рис. 2. Если
документ вводится в систему с помощью сканера, его графический образ преобразуется в
текстовый файл с помощью средств распознавания символов.





Содержание раздела