Семантическая паутина

Материал из Википедии — свободной энциклопедии


Семанти́ческая паути́на (англ. Semantic web) — новая концепция развития Всемирной паутины и сети Интернет, принятая и продвигаемая Консорциумом Всемирной паутины. Иногда также упоминается как семантический веб.


Цель

Семантическая паутина — это надстройка над существующей Всемирной паутиной, которая призвана сделать размещённую в сети информацию более понятной для компьютеров. Известно, что почти вся информация в Интернете находится в текстовой форме. Не секрет также, что прогресс в области обработки человеческих языков (англ. Natural Language Processing, NLP) идёт очень медленно. Компьютеры не могут воспринять и осмыслить словесную информацию, размещённую в Интернете, и в ближайшее время, видимо, не смогут. Тогда встаёт вопрос — как же заставить компьютеры понимать смысл размещённой в сети информации и научить компьютеры пользоваться ею? На этот вопрос и призвана ответить концепция семантической паутины. Слово «семантическая» в данном случае означает «осмысленная», «понятная».

Основная идея

В настоящее время компьютеры принимают довольно ограниченное участие в формировании и обработке информации в сети Интернет. Трудно вообразить, но это так. Функции компьютеров в основном сводятся к хранению, отображению и поиску информации. В то же время создание информации, её оценку, классификацию и актуализацию — всё это по-прежнему выполняет человек. Как включить компьютер в эти процессы? Если компьютер пока нельзя научить понимать человеческий язык, то нужно использовать язык, который был бы понятен компьютеру. То есть, в идеальном варианте вся информация в Интернете должна размещаться на двух языках: на человеческом языке для человека и на компьютерном языке для понимания компьютера. Семантическая паутина — это концепция сети, в которой каждый ресурс на человеческом языке был бы снабжён описанием, понятным компьютеру.

Реализация

Для создания понятного компьютеру описания ресурса в семантической паутине используется формат RDF (англ. Resource Description Framework), который основан на синтаксисе XML и использует идентификаторы URI для обозначения ресурсов. RDF был утверждён как стандарт W3C в феврале 2004 года. RDF — это система описания сетевых ресурсов, понятная компьютеру. Формат RDF предназначен для хранения метаданных (метаданные — это данные о данных). В соответствии с концепцией семантической паутины, описания в формате RDF должны прикрепляться к каждому сетевому ресурсу. Документы RDF должны обрабатываться компьютером автоматически, RDF не предназначен для прочтения и использования человеком. К настоящему времени формат RDF уже устоялся и получил широкое распространение, он служит каркасом для создания семантической паутины.

RDFS (англ. RDF Schema) — это важная надстройка над RDF, позволяющая создавать классы и свойства (как в объектно-ориентированном программировании в рамках конкретного приложения).

Следующим важным направлением концепции семантической паутины является язык OWL (англ. Web Ontology Language, произносится [о́ул]), который стал Рекомендацией W3C в феврале 2004 года. Этот язык построен на форматах RDF и RDFS, он предназначен для обработки информации в сети. Язык OWL имеет 3 степени детализации, что является новым словом в компьютерных технологиях. Он также легко масштабируется и совместим с самыми передовыми сетевыми стандартами.

SPARQL (англ. Protocol And RDF Query Language, произносится [спа́ркл]) — новый язык запросов для быстрого доступа к данным RDF. Используя обычный протокол и язык SPARQL, приложения могут анализировать RDF-описания ресурсов и получать из сети нужную информацию.

Плюсы и минусы

Положительная сторона концепции очевидна. Семантическая паутина открывает доступ к чётко структурированной информации для любых приложений, независимо от платформы, независимо от языков программирования. Программы смогут сами находить нужные ресурсы, обрабатывать информацию, обобщать данные, выявлять логические связи, делать выводы и даже принимать решения на основе этих выводов. При широком распространении и грамотном внедрении семантическая паутина может вызвать революцию в Интернете.

Главный минус концепции — сложность внедрения. Формат RDF был разработан людьми с академическим образованием и изначально не был рассчитан на применение рядовыми пользователями Интернета. Даже многим веб-мастерам и программистам бывает сложно освоить RDF и OWL. Кроме того, сам смысл концепции ещё не доведён до широких кругов пользователей. Работа по популяризации семантической паутины ещё не на достаточном уровне, не хватает практических примеров. Ощущается явная нехватка утилитарных программ, способных облегчить разработку RDF-документов для обычных пользователей.

История

Автором идеи семантической паутины считается Тим Бернерс-Ли. История концепции уходит корнями в середину 90-х годов XX века, первые детализированные публикации относятся к 1998 году. С 1999 года проект семантической паутины развивается под эгидой Консорциума Всемирной паутины. В период с 1999 по 2004 год работу над концепцией вела группа разработчиков «RDF Interest Group», в 2004 году группа была переименована в «Semantic Web Interest Group».

Первым серьёзным и популярным проектом, основанным на принципах семантической паутины, стал проект «Дублинское ядро» (англ. Dublin Core Metadata Initiative, DCMI). Это открытый проект, цель которого — разработать стандарты метаданных, которые были бы независимы от платформ и подходили бы для широкого спектра задач. Конкретнее, DCMI занимается разработкой специальных словарей метаданных (англ. metadata vocabularies), стандартизирующих описания ресурсов Всемирной паутины в формате RDF.

Перспективы

Многие всё еще ставят под сомнение успех проекта семантической паутины, но скептиков становится все меньше и меньше. Началось внедрение этой концепции многими крупными компаниями и корпорациями, что однозначно говорит об успехе. Кроме того, семантическая паутина активно пропагандируется и внедряется многими проектами с открытым исходным кодом.

Литература

Фундаментальным трудом по семантической паутине является книга Бернерса-Ли «Прядя семантическую паутину: полное раскрытие потенциала Всемирной паутины» (англ. «Spinning the Semantic Web: Bringing the World Wide Web to Its Full Potential», The MIT Press, 2005, ISBN 026256212X). Редакторами книги выступили другие известные энтузиасты семантической паутины: Джеймс Хендлер, Дитер Фензель, Генри Либерман и Вольфганг Вальстер. В этой книге концепция семантической паутины раскрывается наиболее полно.

См. также

* Семантическая сеть
* Semantic Wiki

Ссылки

* Официальный портал семантической паутины
* Общественный портал семантической паутины
* Энциклопедия терминов семантической паутины
* Русскоязычный ресурс полностью посвященный Semantic Web
* Русскоязычный Блог о Semantic Web
* Dublin Core Metadata Initiative (DCMI)
* Популярный проект «Друг друга» (Friend of a Friend, FOAF), построенный на принципах семантической паутины
* Коротко о семантической сети
* Семантическая сеть — перевод известной статьи изобретателя Всемирной Паутины Тима Бернерса-Ли (в соавторстве с Джеймсом Хендлером и Орой Лассилой), опубликованной в журнале Scientific American в мае 2001.
Оригинал статьи: The Semantic Web

Комментариев нет: