Технология работы систем EDMS первого поколения
Суть индексирования по ключевым словам (или атрибутного индексирования) заключается в
том, что для каждого вводимого или сохраняемого документа заполняются соответствующие
поля в индексном файле. Заполнение осуществляется как вручную, так и с помощью программы,
которая по какому-либо признаку выделяет в документе значения ключей/атрибутов.
Серьезные ограничения при использовании этих систем связаны со следующими
обстоятельствами:
- Определение ключевых слов - достаточно субъективный процесс; даже при
участии самого независимого эксперта трудно избежать одностороннего влияния
и субъективности при выборе ключевых слов.
- Определение ключевых слов - достаточно дорогостоящая процедура (по
оценкам AIIM** составляет от $5 до $20 на документ) из-за невозможности
автоматической индексации и низкой производительности при определении
ключевых слов вручную.
- Предполагается, что пользователи будут осуществлять поиск информации
предсказуемым способом, т.е. по тем ключевым словам, которые были
заложены.
- Поиск по ключевым словам - это четкий поиск, т.е. пользователь должен
знать в точности то, что он ищет. Если сделана ошибка при написании ключевого
слова в запросе для поиска, система никогда не найдет нужную информацию.
- Ключевые слова могут меняться со временем, т.е. понятия, которые были
"ключевыми" вчера, вовсе не необязательно будут столь же важны через
год.
Технология работы с системами EDMS второго поколения представлена на рис. 2. Если
документ вводится в систему с помощью сканера, его графический образ преобразуется в
текстовый файл с помощью средств распознавания символов.