Webcat - Подсказка
Здесь описываеются страницы демонстрационного пользовательского интерфейса к системе автоматической самообучающейся (на основе ручного ассоциирования документов и категорий а также коррекции особенностей) системе классификации текстов Webcat (частью системы Webmine для извлечения информации из текстов).
Предупреждение: Это просто тестовые-демонстрационные страницы, основанные на простых HTML и JavaScript, так что производительность операций пользовательского интерфейса может быть ограничена. Возможно, придётся иногда ждать, чтобы содержание страницы обновилось после события в пользовательском интерфейсе. Также, содержимое всех списков (в демо-версии пользовательского интерфейса) огранично 500-ми элементами, так что большее количество категорий, документов и особенностей не может быть отображено.
Источник: Выпадающий список позволяет указать интересующий источник документов - только соответствующие ему документы будут показаны в спсике ниже.
Документы: Список показывает все документы из источника, указанного выше. Документы могут представлять из себя либо URL-ссылки (предпочтительно на веб-страницы с простой HTML-структурой) либо просто свободно введенный текст. Окно ввода и кнопки ниже позволяют ввести новый документ и выполнить другие операции, перечисленные ниже.
- Добавить - Добавляет к источнику новый документ, с текстом или URL указанном в окошке ввода <Текст или URL ...>.
Только обычный текст и простой HTML (без сложной разметки) могут быть нормально обработаны.- Удалить - удаляет документ из источника.
- Обновить - обновляет все автоматические назначения категорий (после их перенастройки) к документу.
- Сохранить - обновляет сохраненное состояние системы в целом.
Особенности документа: В списке показывается упорядоченная последовательность характерных особенностей (features) выбранного документа, а именно - найденных в нем ключевых слов. В первой колонке выводится плюс - если подтвержена характерность слова для документа, пустое место - если ключевое слово попало в документ по ошибке или вопросительный знак - если нет уверенности в данном слове. Цифра от (0 до 1) во второй колонке указывает "силу связи" между словом и документом, а количество звездочек ("*", от 0 до 10) демонстрирует эту "силу" наглядно. Окно ввода и кнопки ниже позволяют добавить новую особенность к документу и выполнить другие операции, перечисленные ниже.
- Добавить - добавить к документу особенность (ключевое слово), указанное в окошке ввода <Новая особенность документа>.
- Подтвердить - последовательное нажатие кнопки меняет "статус подтверждения" выбранной в списке особенности. Возможны три значения статуса: знак ? означает Не подтверждено, так что система сама принимает решение о том, насколько данная особенность присуща документу; знак + означает Подтверждено положительно, так что система принимает суждение пользователя о том, что выбранная особенность высоко характерна для данного документа; пустое место или пробел означает Подтверждено отрицательно, то есть система будет полагать, что данная особенность не характерна для документа вообще.
- Прятать - включение отметки прячет все особенности, кроме подтвержденных положительно.
Текст документа: В окне показывается текст документа с выделением особенностей или ключевых слов - чем больше "сила связи" слова с самим документом, тем более темным цветом выделено само слово (с удалением исходного форматирования).
Категории документа по разделу: Выпадающий список позволяет выбрать раздел категорий ассоциированных или для для ассоциирования с указанным документом.
Категории документа: В списке показан список категорий по выбранному разделу ассоциированных с документом в данный момент. Элементы списка отсортированы в соответсвии со "статусом подтверждения" ассоциированности категории с документом а также количественной оценки релевантности категории документу - аналогично описанному для особенностей документа выше. Выпадающий список ниже и соотвествующие кнопки позволяют добавить новую категорию к документу, а такжу управлять ассоциированием категорий.
- Добавить - добавить к документу категорию заданного раздела, выбранную в выпадающем списке слева.
- Подтвердить - последовательное нажатие кнопки меняет "статус подтверждения" выбранной в списке выше категории. Возможны три значения статуса: знак ? означает Не подтверждено, так что система сама принимает решение о том, насколько данная категория ассоциируется с документом; знак + означает Подтверждено положительно, так что система принимает суждение пользователя о том, что выбранная категория ассоциируется с данным документом; пустое место или пробел означает Подтверждено отрицательно, то есть система будет полагать, что данная категория не ассоциируется с документом вообще.
- Прятать - включение отметки прячет все особенности, кроме подтвержденных положительно.
Источник: http://www.webstructor.net/mineРаздел: Выпадающий список выбора разделов категорий позволяет выбрать интересующий раздел категорий для показа в списке категорий ниже.
Категории: Список показывает все категории по выбранному выше разделу. Текстовое окно ввода и кнопки ниже позволяют дополнить и отредактировать список категорий, в соотвествии с приведенным ниже описанием.
- Добавить - Добавляет в раздел новую категорию, с названием указанном в окошке ввода <Имя новой категории>.
- Удалить - удаляет категорию из раздела.
- Обновить - обновляет все автоматически сформированные ассоциации между категориями и особенностями (ключевыми словами).
- Сохранить - обновляет сохраненное состояние системы в целом.
Особенности категории: Этот список аналогичен описанному выше списку особенностей (features) документа описанному выше, с тем лишь отличием, что показывает и позволяет редактировать (добавлять и подтверждать) особенности для конкретной категории, указанной в списке категорий.
Источник: Этот список аналогичен описанному выше списку источников для выбора документов по заданной катеогрии в списке ниже.
Документы: Этот список аналогичен описанному выше списку документов с той лишь разницей, что показываются документы соответствующие как выбранной категории, так и указанному источнику. Здесь же можно не только добавить документ к источнику, одновременно ассоциировав его с категорией, так и подтвердить степень ассоциирования его с выбранной категорией аналогично тому, как описано для списка категорий документа.
Текст документа: В окне показывается текст документа выбранного в списке выше с выделением особенностей или ключевых слов - чем больше "сила связи" слова как с самим документом, так и самой категорией, тем более темным цветом выделено само слово (с удалением исходного форматирования).
Особенности документа: В списке показывается упорядоченная последовательность характерных особенностей (features) самого выбранного документа, аналогично списку особенностей документа описанному выше, то есть без учета ассоциации с указанной категорией.