Semantic Web & электронные сми илья клинцов

15
www.rit2007.ru Илья Клинцов Руководитель проекта Департамент развития бизнеса www.avicomp.com Semantic Web & электронные СМИ

Transcript of Semantic Web & электронные сми илья клинцов

Page 1: Semantic Web & электронные сми   илья клинцов

www.rit2007.ru

Илья КлинцовРуководитель проекта

Департамент развития бизнеса

www.avicomp.com

Semantic Web & электронные СМИ

Page 2: Semantic Web & электронные сми   илья клинцов

www.rit2007.ru

Semantic Web - новые информационные технологии

Проект Semantic Web нацелен

на необходимость

формирования надстройки

над существующей системой

Интернет, которая призвана

сделать размещённую в

Интернете информацию

одинаково удобной для

обработки и понимания

компьютерами и людьми.

Page 3: Semantic Web & электронные сми   илья клинцов

www.rit2007.ru

Перспективы и основные этапы развития

Page 4: Semantic Web & электронные сми   илья клинцов

www.rit2007.ru

Обработка естественно-языковых текстов

Департамент лингвистических технологий• 2 доктора наук,

несколько кандидатов наук, десятки квалифицированных лингвистов и опытных разработчиков

• 6 лет научно-технологических исследований в области прикладной лингвистики

Page 5: Semantic Web & электронные сми   илья клинцов

www.rit2007.ru

Модель предметной областиДля выполнения анализа текста необходимо

определить модель предметной области (онтологию), содержащую объекты и их свойства

Фрагмент модели предметной области

Например, приведенный фрагмент можно интерпретировать так:

Необходимо распознавать информацию о (всех) персонах, организациях, и местоположениях

Причем, интерес представляют факты работы персон в организациях, местоположение организаций, места жительства персон.

Page 6: Semantic Web & электронные сми   илья клинцов

www.rit2007.ru

Лингвистический анализВ рамках некоторой заданной модели, описывающей типы распознаваемых

объектов и их свойства, используя специальные словари и лингвистические правила, система извлекает из текстов релевантную

для пользователя информацию

   

Кириенко Сергей1701

   

ФамилияИмяid

  

Росатом5536  

Названиеid

     

5536 Руководитель1701875663

     

ГдеКогда (дата)

Кем (должность)Ктоid

Page 7: Semantic Web & электронные сми   илья клинцов

www.rit2007.ru

Хранение семантической информации

При организации хранилища используются стандарты w3.org в рамках активности Semantic Web:• RDF – способ

представления данных

• SPARQL - язык запросов

• OWL – Ontology Web Language

BA

G

D

C

FG

Page 8: Semantic Web & электронные сми   илья клинцов

www.rit2007.ru

Масштабируемая «grid» архитектура решения

Page 9: Semantic Web & электронные сми   илья клинцов

www.rit2007.ru

Интеграция информации

После сохранения необходимо выявить и объединить идентичные объекты из разных документов.

МОСКВА, 15 мая - РИА Новости. Руководитель Росатома Сергей Кириенко 19-23 мая в ходе поездки в США проведет ряд рабочих встреч, посвященных двустороннему сотрудничеству в области мирного использования атомной энергии, говорится в сообщении пресс-службы Росатома. Планируется, что Кириенко 22 мая проведет переговоры с министром энергетики США Самюэлом Бодманом и руководителем комиссии по ядерному регулированию США Нильсом Диазом.

МОСКВА, 15 мая - РИА Новости. Руководитель Росатома Сергей Кириенко 19-23 мая в ходе поездки в США проведет ряд рабочих встреч, посвященных двустороннему сотрудничеству в области мирного использования атомной энергии, говорится в сообщении пресс-службы Росатома. Планируется, что Кириенко 22 мая проведет переговоры с министром энергетики США Самюэлом Бодманом и руководителем комиссии по ядерному регулированию США Нильсом Диазом.

тексты отдельные графы база знаний

Page 10: Semantic Web & электронные сми   илья клинцов

www.rit2007.ru

Решение для Средств Массовой Информации

Типы объектов:• Персоны• Организации• Политические кланы

и партии• Местоположения• Должности, ученые

степени• Высказывания• …19 основных типов

Типы отношений:• Работать • Дружить• Лоббировать• Участвовать• Влиять• Быть связанным• …

18 основных типов

Page 11: Semantic Web & электронные сми   илья клинцов

www.rit2007.ru

Семантическая навигация

Page 12: Semantic Web & электронные сми   илья клинцов

www.rit2007.ru

Аналитические сервисы

Page 13: Semantic Web & электронные сми   илья клинцов

www.rit2007.ru

Типы объектов:• Медикаменты• Симптомы,

синдромы и состояния

• Производитель• Фармакологическа

я группа • Действующее

вещество • …

11 типов

Информационный портал: media.medtrust.ru

Типы отношений:• Показания и

противопоказания• Усиливает,

ослабляет действие

• Является аналогом• Относится к

фармакологической группе

• … 15 типов

Page 14: Semantic Web & электронные сми   илья клинцов

www.rit2007.ru

Карточка объекта

Связи объекта

Релевантные Документы

Page 15: Semantic Web & электронные сми   илья клинцов

Спасибо!

Вопросы?

www.rit2007.ru

www.avicomp.com