Linked data, semantic web и семантические вики

Post on 15-Jun-2015

2.029 views 2 download

Tags:

Transcript of Linked data, semantic web и семантические вики

1

Semantic Web и семантические викиИнтересная наука, полезные

бизнес-приложения

02.02.2013

Катков Юрий, WikiVote

2

ВВЕДЕНИЕ

02.02.2013

3

Что веб-разработчики думают о Semantic Web?

• Когда-то кто-то пытался сделать веб машиночитаемым

• Проект провалился, очень уж сложная оказалась задача

• Все про это потихоньку забылиПочему это неправильная история: • Semantic web уже здесь!

02.02.2013

402.02.2013

502.02.2013

602.02.2013

702.02.2013

802.02.2013

902.02.2013

1002.02.2013

1102.02.2013

1202.02.2013

13

Что такое Semantic Web сегодня• Данные

– Data.gov, Data.gov.uk и терабайты гос. данных в Европе, Азии и Америке

• Коммерческие продукты– Oracle Spatial and Graph (Oracle 11g)– IBM DB2 10– IBM Watson– Apple Siri

• Важные элементы back-end’а:– Google Freebase (подмножество Google Knowledge Graph)– Facebook Open Graph– Wikidata (википедия как база данных)– Schema.org – схема описания ресурсов от W3C, Yahoo, Google, Bing,

Yandex• Научные исследования и стандартизация02.02.2013

14

Стандарты

• Ядром Semantic Web являются стандарты• Объект стандартизации – способ

представления и обмена данными• Linked Data использует только часть

стандартов Semantic Web

02.02.2013

15

Слое

ный

пиро

г SW

02.02.2013

16

Слое

ный

пиро

г SW

02.02.2013

17

URIUniform Resource Identifier

служит для однозначного именования

сущностей

основное правило: не существует двух объектов с одинаковыми URI

URL – частный случай URI

02.02.2013

18

Слое

ный

пиро

г SW

02.02.2013

19

позволяет представлять данные в виде троек, формируя граф данных

( subject , predicate , object )

RDF

02.02.2013

20

позволяет представлять данные в виде троек, формируя граф данных

( subject , predicate , object )

RDF

URI URI URI или литерал02.02.2013

21

Леонардо место_рождения ВинчиЛеонардо дата_рождения 15.04.1452

Леонардо да Винчи родился в городе Винчи 15 апреля 1452 года

<http://ex.org/Leo> <http://ex.org/birthDate>

<http://ex.org/Vinci>

"1452-04-15"^^xsd:date

<http://ex.org/Leo> <http://ex.org/birthPlace>

02.02.2013

22

позволяет представлять данные

в виде троек, формируя граф данных ( subject , predicate , object )

RDF

вершина ребро вершина02.02.2013

2302.02.2013

2402.02.2013

25

Графовая модель удобна и гибка

02.02.2013

26

Графовая модель удобна и гибка

02.02.2013

27

Графовая модель удобна и гибка

02.02.2013

28

Графовая модель удобна и гибка

02.02.2013

29

RDF имеет несколько способов записи

02.02.2013

30

RDF имеет несколько способов записи

Turtle

N-triplesN3

02.02.2013

3102.02.2013

@prefix xsd: <http://www.w3.org/2001/XMLSchema#> . @prefix ex: <http://ex.org/> .

ex:Leo ex:birthDate "1452-04-15"^^xsd:date . ex:Leo ex:birthPlace ex:Vinci .

32

RDF имеет несколько способов записи

Turtle

N-triplesN3

XMLJSON

02.02.2013

3302.02.2013

<?xml version="1.0"?> <rdf:RDF

xmlns:xsd="http://www.w3.org/2001/XMLSchema#" xmlns:ex="http://ex.org/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#">

<rdf:Description rdf:about="http://ex.org/Leo"> <ex:birthDate rdf:datatype = "http://www.w3.org/2001/XMLSchema#date">1452-04-15 </ex:birthDate>

<ex:birthPlace rdf:resource="http://ex.org/Vinci" /> </rdf:Description>

</rdf:RDF>

34

Слое

ный

пиро

г SW

02.02.2013

35

RDFS и OWLСтандарты для создания структурированных словарей

02.02.2013

36

RDFS и OWLСтандарты для создания структурированных словарей

КРАТКО02.02.2013

37

RDFS и OWLСтандарты для создания структурированных словарей

02.02.2013

38

RDFS и OWLСтандарты для создания

02.02.2013

структурированных словарей

39

RDFS и OWLСтандарты для создания

02.02.2013

структурированных словарей

классификаций

40

RDFS и OWLСтандарты для создания

02.02.2013

структурированных словарей

глоссариев

классификаций

41

RDFS и OWLСтандарты для создания

02.02.2013

структурированных словарей

глоссариев

классификацийтезаурусов

42

RDFS и OWLСтандарты для создания

02.02.2013

структурированных словарей

глоссариев

классификаций

тематических карт

тезаурусов

43

RDFS и OWLСтандарты для создания

02.02.2013

структурированных словарей

глоссариев

таксономий

классификаций

тематических карт

тезаурусов

44

RDFS и OWLСтандарты для создания

02.02.2013

структурированных словарей

глоссариев

таксономий

классификаций

тематических карт

тезаурусов

семантических сетей

45

RDFS и OWLСтандарты для создания

02.02.2013

структурированных словарей

глоссариев

таксономий

классификаций

тематических карт

тезаурусов

семантических сетей

схем данных

46

RDFS и OWLСтандарты для создания

02.02.2013

структурированных словарей

глоссариев

таксономий

классификаций

тематических карт

тезаурусов

семантических сетей

схем данных

TBox

47

RDFS и OWLСтандарты для создания

02.02.2013

структурированных словарей

онтологий

таксономий

классификаций

тематических карт

схем данных

глоссариевсемантических сетей

тезаурусов

TBox

48

ЗАЧЕМ НУЖНЫ

02.02.2013

Структурированные словари

онтологии

схемы данных

глоссариисемантические сети

таксономии

классификации

тематические карты

тезаурусы

TBox

4902.02.2013

Онтологии нужны для

5002.02.2013

стандартизациитерминологии

Онтологии нужны для

Предложение: связь национальностьБудем всегда называть терминомhttp://dbpedia.org/property/nationality« »

5102.02.2013

стандартизациитерминологии

автоматического обогащения данных

Онтологии нужны для

Предложение: связь национальностьБудем всегда называть терминомhttp://dbpedia.org/property/nationality« »

Любой, кто имеет свойствонациональность, является

человеком, а его национальностьявляется страной. А страна – это

частный случай населенного места« »

Давайте, если говорим о Леонардо даВинчи, будем всегда пользоваться его идентификатором в Dbpedia« »

5202.02.2013

Автоматическое обогащение данных

53

Автоматическое обогащение данных

02.02.2013

54

Автоматическое обогащение данных

02.02.2013

55

Автоматическое обогащение данных

02.02.2013

5602.02.2013

Автоматическое обогащение данных

5702.02.2013

Автоматическое обогащение данных

58

Слое

ный

пиро

г SW

02.02.2013

59

SPARQLЗапросы к RDF-данным

02.02.2013

60

SPARQLSPARQL Protocol and RDF Query Language

02.02.2013

6102.02.2013

6202.02.2013

6302.02.2013

6402.02.2013

6502.02.2013

http://dbpedia.neofonie.de

http://dbpedia.org/sparql

66

PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> PREFIX dbpedia-owl: <http://dbpedia.org/ontology/>

SELECT * WHERE { ?a rdf:type dbpedia-owl:Company . } LIMIT 100OFFSET 300

Выполняем на dbpedia.org/sparql

02.02.2013

6702.02.2013

68

?a rdf:type dbpedia-owl:Company

Запрос:

02.02.2013

69

?a rdf:type dbpedia-owl:Company

Запрос:

02.02.2013

70

НАУКА И СЕМАНТИЧЕСКИЕ ТЕХНОЛОГИИ

Чем заняться учёному

02.02.2013

71

Как найти свою семантическую научную тему

• Изучите основы: – Semantic University– очные школы в России и за рубежом– Вебинары и видеолекции

• Живите жизнью сообщества: – списки рассылки: Semantic Web mailing list, LOD mailing list– новости на semanticweb.com, в блогах

• Читайте программы мероприятий: – WWW Conference– ISWC, ESWC, WIMS, LDOW, SEMTECH,

02.02.2013

72

Актуальные темы (на 2013 г)• Дескрипционная логика и алгоритмы логического вывода:

– ускорение алгоритмов– более выразительные логики– унификация логики

• Хранение графовых данных, преобразование SQL-SPARQL• Оптимизация SPARQL-запросов, федерация запросов,

распределенное выполнение• Доверие в SW, проверка и выдача обоснований логических

выводов• Семантические веб-сервисы• Смежные темы: Name Entity Recogninition, Data Mining,

управление знаниями, визуализация, мультиагентные системы, формальный анализ понятий

02.02.2013

73

Слое

ный

пиро

г SW

02.02.2013

74

СЕМАНТИЧЕСКИЕ ТЕХНОЛОГИИ И ПРОМЫШЛЕННОСТЬ. LINKED DATA

Чем заняться инженеру

02.02.2013

75

Слое

ный

пиро

г SW

02.02.2013

Здесь практические приложения

76

Семантические технологии в бизнесе. Семантические вики

• Семантическая вики – это Semantic Web в миниатюре

02.02.2013

Вики• Простое

редактирование• Хранение истории

изменений• Простота

исправления ошибок

Структурированные вики• Структура

данных• Запросы к

данным• Гибкое

представление данных

Семантические вики• Логический вывод• Поддержка

стандартов SW

77

Семантические технологии в бизнесе. Семантические вики

02.02.2013

• Традиционные вики:+ очень динамичны и просты+ поддерживают обновление

структуры данных+ легко исправлять ошибки

НО– быстро засоряются– быстро рассогласовываются– тяжело находить данные– нет общей картины

• Базы данных+ имеют четкую структуру

НО– структура не динамична– стоимость расширения

на новые области высока

– механизмы обновления и отката данных программируются отдельно

78

Простейшая вики

02.02.2013

Страницы и ссылки

79

Традиционная вики

02.02.2013

Категории

80

Традиционная вики

02.02.2013

Категории

81

Традиционная вики

02.02.2013

Категории

82

Структурированная вики

02.02.2013

Именованные ссылки

83

Структурированная вики

02.02.2013

Связь с типизированными данными

84

Структурированная вики

02.02.2013

Запросы к данным

{{#ask: [[ :Категория Город]] [[ ::Население >10 000 000]]|?Население}}

85

Структурированная вики

02.02.2013

Представление данных

86

Структурированная вики

02.02.2013

Представление данных

87

Структурированная вики

02.02.2013

Представление данных

88

Структурированная вики

02.02.2013

Представление данных

89

Структурированная вики

02.02.2013

Представление данных

9002.02.2013

Семантическая викиАвтоматический вывод знаний

9102.02.2013

Семантическая викиАвтоматический вывод знаний

92

Семантическая вики

02.02.2013

Автоматический вывод знаний

93

Семантическая вики

02.02.2013

Другие часто встречающиеся функции

• Экспорт и импорт RDF и OWL-онтологий• Использование RDF-хранилищ• Поддержка SPARQL• Контроллируемый естественный язык• Фасетный, уточняющий поиск• Конвертация единиц измерения• Генерация документов

94

Движки семантических вики

02.02.2013

• OntoWiki• The Information Workbench• Semantic MediaWiki• TWiki• TikiWiki• AceWiki

95

Слое

ный

пиро

г SW

02.02.2013

9602.02.2013

9702.02.2013