MaxEdu.ru
» » » Використання фреймів та семантичних мереж для обробки природньої мови
Вернуться назад

Використання фреймів та семантичних мереж для обробки природньої мови

Зміст
Обробка природньої мови
Семантичні мережі
Історична нотатка
Реляційні графи
Графи із центром на дієслові
Пропозиційні мережі
Ієрархія типів
Машина реалізація
Теорія фреймів
Розпізнання
Розмір фрейму
Ініціалізаційні категорії
Об'єктно - орієнтовані мови
Основні проблемиобробки природньої мови
Технології аналізу природньої мови
Стійкість аналізу
Експертні системи та їх архітектура
Гіпертекстові системи
Висновок

Забезпечення взаємодії з ЕОМ на природній мові (ПМ) є найважливішою метою досліджень зі штучногоінтелекту (ШІ). Бази даних, пакети прикладних програм та експертні системи, засновані на ШІ, потребуютьоснащення гнучким інтерфейсом для численних користувачів, що не бажають спілкуватися із комп'ютером на штучній мові. У той час як багато фундаментальних проблем у областіопрацюванняПМ (Natural Language Processing, NLP) ще не вирішені, прикладні системи можуть мати інтерфейс, що розуміє ПМ за певних обмежень.
Існують два види і, отже, дві концепції опрацювання природної мови:
· для окремих речень;
· для ведення інтерактивного діалогу.
Обробка природньої мови
Обробка природної мови - це формулювання та дослідження комп'ютерно-ефективних механізмів для забезпечення комунікації з ЕОМ на ПМ. Об'єктами досліджень є:
·власне природні мови;
·використання ПМ як для комунікації між людьми, так і для комунікації людини з ЕОМ.
Мета досліджень - створення комп'ютерних-ефективних моделей комунікації на ПМ. Саме така постановка задачі відрізняє NLP від задач традиційної лінгвістики та інших дисциплін, що вивчають ПМ, і дозволяє віднести її до областіШІ. Проблемою NLP займаються дві дисципліни: лінгвістика та когнітивна психологія.
Традиційно лінгвісти займалися створенням формальних, загальних, структурних моделей ПМ, і тому віддавали перевагу таким моделям, що дозволяли виявляти якнайбільше мовних закономірностей і робити узагальнення. Практично жодної уваги не приділялося придатності моделей з точки зору комп'ютерної ефективності їх застосування. Таким чином, виявилося, що лінгвістичні моделі, характеризуючи власне мову, не розглядали механізми його породження і розпізнавання. У цьому випадку, гарним прикладом постаєпороджуячаграматикаХомського, що виявилася абсолютно негожою на практиці у якості бази для комп'ютерного розпізнання ПМ.
Для когнітивної психології метою є не моделювання структури мови, а її використання. Спеціалісти цієї галузі також не приділяли великого значення проблемі комп'ютерної ефективності
Виділяютьзагальну і прикладну NLP. Метою.загальної NLP єрозробка моделей використання мови людиною, які б за цієї умови залишалися комп'ютерно-ефективними. Базовим для цього єзагальне розуміння текстів, як це визначається у роботах Чарняка, Шенка, Карбонелла та ін. Без сумніву, загальна NLP потребує величезних знань про реальний світ, і більша частина робіт зосереджена на представлені таких знань і їх застосування із метою розпізнаванні повідомлення, що надходить на ПМ. На сьогоднішній день, ШІ ще не досяг такого рівня розвитку, коли для вирішення подібних задач у великому обсязі використовувалися б знання про реальний світ, а відтоді існуючі системи можна називати лише експериментальними, оскільки вони працюють з обмеженою кількістю старанно відібраних шаблонів на ПМ.
Прикладна NLP займається звичайно не моделюванням, а безпосередньо можливістю комунікації людини з ЕОМ на ПМ. У цьому випадку вже не так важливо, як введений вираз буде зрозумілим з точки зору знань про реальний світ, а важливим є одержання інформації про те, чим і як може бути корисною для користувача ЕОМ (прикладом може бути інтерфейс експертних систем). Крім розуміння ПМ, у таких системах важлим є також розпізнання помилок та їх корекції.
Семантичні мережі.
Семантична мережа – це структура для уявлення знань у виді вузлів, сполучених дугами. Найперші семантичні мережі були розроблені в якості мови-посередника для систем машинного перекладу, а багато сучасних версій навіть зараз подібні по своїх характеристиках до природньої мови. Проте, останні версії семантичних мереж стали більш потужними і гнучкими та складають конкуренцію фреймовым системам, логічному програмуванню й іншиммовампредставлення.
Починаючи з кінця 50-ых років, на практиці були створені і застосовані десятки варіантів семантичних мереж. Незважаючи на те, що їх термінологія та структура відрізняються, проте існують збіжності, що притаманні практично всім семантичним мережам:
1. вузли семантичних мереж являють собою концепти предметів, подій, станів;
2. різноманітні вузли одного концепту відносяться до різних значень, якщо вони не пізначені як такі, що вони відносяться до одного концепту;
3. дуги семантичних мереж утворюють відношення між вузлами-концептами (позначки над дугами вказують на тип відношення);
4. деяківідношення між концептами являють собою лінгвістичні відмінки, такі, як: агент, об'єкт, реципієнт та інструмент (інші означають тимчасові, просторові, логічні відношення та відношення між окремими реченнями;
5. концепти організовані по рівнях у відповідності зі ступенем узагальненості. Наприклад, сутність, живаістота, тварина, хижак;
Проте, існують і відміності: розуміння значення з точки зору філософії; методи представленнякванторов спільності й існування та логічних операторів; засоби маніпулювання мережами та правила виводу, термінологія. Все це змінюється від автора до автора. Недивлячись не деякі відмінності, мережі зручно читаються та обробляються комп'ютером, а також є досить потужними для того, щоб уявити семантику природної мови.
Історична нотатка
Фрегуявив логічні формули у вигляді дерев, які, проте, слабо нагадують сучасні семантичні мережі. Ще одним піонером став ЧарльзСандерзПрис, що використовував графічні записи в органічній хімії. Він сформулював правила виводу із використанням екзістенційних графів.
У психології Сальтисон використовував графи для подання спадкоємності деяких характеристик у ієрархії концептів. Наукові дослідження Сальтисону мали величезний вплив на вивчення тактики шахів. Він, у свою чергу, вплинув на таких теоретиків, як Саймон і Ньюэлл.
Що стосується лінгвістики, то першимвченим, який займався розробкою графічних описів, став Теньер. Він використовував графічний запис для власної граматики залежностей. Теньер зробив величезний вплив на розвиток лінгвістики в Європі.
Вперше семантичні мережі були використані у системах машинного перекладу наприкінці 50-х - початку 60-х років. Перша така система, яку створила Мастерман, містила біля 100 примітивних концептів таких, як, наприклад, НАРОД, РІЧ, РОБИТИ, БУТИ. За допомогою цих концептів вона зробила опис словнику обсягом 15000 одиниць, у якому також існував механізм для переносу характеристик з гіпертипу на підтип. Деякі системи машинного перекладу базувалися на кореляційних мережахЦеккато, що являли собою набір із 56 різноманітних відношень, деякі з який - відмінкові відношення, відношення підтипу, часток, частини та цілого. Він використовував мережі, що складалися з концептів та відношень, для управління діями парсера та вирішення неоднозначностей.
У системах штучного інтелекту семантичні мережі використовуються для отримання відповедей на різноманітні запитання, вивчення процесів навчання, запам'ятовування та міркувань. Наприкінці 70-хмережі стали широко поширеними. У 80-х роках межа між мережами, фреймовыми структурами і лінійними формами запису поступово зникали. Сила виразності більше не є вирішальним аргументом на користь вибору мереж або лінійних форм запису, оскільки ідеї записані за допомогою однієї форми запису можуть бути легко переведені в іншу. І навпаки, особо важливе значення отримали другорядні чинники такі, як: читаність, ефективність, нештучність та теоретична елегантність. До уаги також береться легкість введення в комп'ютер, редагування та роздрук.
Реляційні графи.
Найпростіші мережі, які використовуються в системах штучного інтелекту – це реляційні графи. Вони складаються з вузлів, що сполучені дугами. Кожний вузол являє собою поняття, а кожна дуга - відношення між різноманітними поняттями. На малюнку 1 подане речення “Собака жадібно гризе кістку”. Чотири прямокутники подають поняття собаки, процесу гризіння, кістки і такої характеристики, як жадібність. Надписи над дугами означають, що собака є агентом грізіння, кістка є об'єктом гризіння, а жадібність - це манера гризіння.
Термінологія, що використовується в цій області різноманітна. Для того, щоб отримати деяку однорідність, вузли, сполучені дугами, слід називати графами, а структуру, де є ціле гніздо з вузлів або де існують відношення різноманітного порядку між графами, зветься мережею. Окрім термінології, що використовується для пояснення, також різняться засоби зображення. Інколи використовуються кружечки замість прямокутників; іноді пишуться типи відношень одразу понад дугами, не розміщуючи їх в овали; іноді використовуються абревіатури, наприклад О чи А для позначення агента або об'єкта; іноді використовуються різноманітні типи стрілок. На малюнку 2 зображений граф концептуальних залежностей Шенка. означає агента. INGEST (поглинати) - один із примітивів Шенка: ЇСТИ - ПОГЛИНАТИ твердий об'єкт; ПИТИ - ПОГЛИНАТИ рідкий об'єкт; ДИХАТИ - ПОГЛИНАТИ газоподібний об'єкт. Додаткова скла зліва означає, що кістка передається із невказаного місця до собаки.
Оскільки досить складно ввести у комп'ютер деякі діаграми, то багато вчених записують свої графи у більш компактному вигляді. Наприклад, те саме речення Сова запропонував записати в лінійномувигляді із використанням деяких елементів із малюнка 1:
[ЇСТИ]-
(AGNT) -> [СОБАКА]
(OBJ) -> [КІСТКА]
(MANR) -> [ЖАДІБНІСТЬ]
У цьому варіанті запису квадратні дужки позначають поняття, а круглі дужкимістять назви відношень. Всі лінійні форми запису дуже подібні до фреймових структур.
Графи із центром на дієслові.
Дієслова з'єднуються із групою іменника з використанням відмінкових відношень. Наприклад, іу речені “Mary gave a book to Fred”, Mary агент даванія, book об'єкт цього процесу, а Fred реципієнтдієслова “давати”. Окрім відмінкових відношень у речені поданого природньою мовою також єзасоби для зв'язку окремих речень. Такі відношення необхідні у таких випадках:
Союзи . Самий простий спосіб з'єднати речення - це поставити між ними союз. Деякі ссоюзи, як наприклад “і”, “або”, “якщо” позначають логічний зв'язок; деякі, такі як “після того, як”, “коли”, “поки”, “з того часу, як” і “тому що”, висловлюють тимчасові відношення і причину.
Дієслова, які потребуютьпідпряднеречення. Відмінкові фреймы багатьох дієслівпотребуютьпідрядні реченя, яке, як правило, є звичайно прямим додатком. До такого типу відносятьсядієслова “говорити”, “вважати”, “міркувати”, “знати”, “бути переконаним”, “загрожувати”, “намагатися” та ін.
Визначники, що відносяться до усього речення. Багато прислівників та пропозициійних фраз відносяться тише до дієслова, але деякі визначають повне речення. Такі прислівники, як “звичайно”, “мабуть”, у більшості випадків ставляться на початку речення. Хоча, наприклад, слово “одного разу” визначає усю розповідь, що йде після нього.
Модальні дієслова та часові форми. Такі дієслова, як “may”, “can”, “must”, “should”, “would” і “could” мають модальне значення і відносяться до усього речення, у якому вони зустрічаються. Тимчасове відношення може бути виражено як формою минулого часу дієслів, так і обставинами “зараз”, “завтра” або “якось” та іншими.
Пов'язаний дискурс . Окрім відношень, поданих у одному речені, існують також відношення більш високого порядку між окремими реченнямидоповіді або розповіді якогось іншого виду. Більшість з них не виражені експліцитно: часові відношення та порядок аргументів може бути, наприклад, імпліцитно подано порядком слідування речень у тексті.
Саме тому, що дієслову приділяється така важлива роль у речені, багато теорій роблять його своїм центральним з’єднувальною ланкою. Цей підхід бере започатковано із Індо-Європейской мовної родини, для якої модальність та часові відношення подаються зміною дієслівної форми. Розглянемотакийприклад: “While a dog was eating a bone, a cat passed by unnoticed”. Уцьомуреченіповідомляється, що, колиречення “While a dog was eating a bone” справджувалось,іншеречення “A cat passed unnoticed” такожсправджувалось. На малюнку 3 зображено граф із центром на дієслові. Союз “while” (WHL) з'єднує вузол PASS-BY із вузлом EAT. На малюнку 3 показано, що собака є агентом не-помічання (not noticing).
Графи із центром у дієслові - це реляційні графи, для яких дієслововважається центральною ланкою будь-якого речення. Маркери часу та відношення записуються безпосередньо поруч із концептами, які представляютьдієслова. Графи концептуальних залежностей РоджераШенка також використовують цей підхід.
Незважаючи на те, що графи із центром на дієслові досить гнучкі за своєю структурою, вони мають деякі обмеження. Одне з яких полягає в тому, що вони не проводять розмежування між визначниками, що відносяться тлише до дієслова, і визначниками, що відносяться до речення вцілому. Роздивимосятакі приклади:
The dog greedily ate the bone.
Greedily, the dog ate the bone.
Ці графи також погано працюють з реченнями, що знаходяться усередині іншихречень.
При роботі з реляційними графами виникають проблеми із передачею усього різноманіття часових відношень та відношень модальності. Незважаючи на те, що багато вчених використовують ці графи для вирішення складних проблем, вони так ще й досі не розробили загального методу їх розв’язку. У вище приведеному прикладі позначка PAST повинна відноситися до усього речення, якеньповідомляє про те, що собака їсть кістку, а не лише до дієслова EAT, оскільки видно, що кістка пізніше була з'їдена собакою цілком. Також повинно бути зазначено, що процес проходу кішки і процес не зваження її собакою відбувалися одночасно.
Пропозиційні мережі
У пропозиційнихмережах вузли ппредставляють цілі речення Ці вузли є точками дотику для відношень між окремими реченнямизв'язаного тексту. З іншогобоку вони визначають час і модальність для всього контексту. Подані нижче приклади ілюструють відношення, для запису яких необхідне використання пропозиційних вузлів:
Sue thinks that Bob believes that a dog is eating a bone.
If a dog is eating a bone, it is unwise to try to take it away from him.
Упершомуреченнідлядієслів “think” і “believe” цілереченяєдоповненням: Бобвважає, що “А dog is eating a bone”, те, щодумаєСьюявляєсобоюбільшскладнеречення-“Bob believes that a dog is eating a bone”. Таке гніздування речень поміж іншихречень може повторюватися як умога велику кількість разів. Щоб зобразити таке речення, необхідно використовувати пропозиційні вузли, що містятьгніздящіся графи. На малюнку 4 зображено пропозиційнумережу для цього речення. Відзначимо, що (EXP) - experiencer, тобто той хто відчуває, з'єднує THINK із Сью, а BELIEVE із Бобом, проте EAT і DOG сполучені між собою агентивнимвідношенням (AGNT). Такі різні типи відношеньспричиняє той факт, що думати та вважати-це стани, у яких знаходяться люди, а поїдання-цедія, яказдійснюється агентом.
В другому прикладі наводяться два речення, що знаходяться у відношенні умови. Антецедентомєречення “А dog is eating a bone”, аконсеквентомречення “It is unwise to try to take it away from him”. Інфінітиви “to try” і “to take” вказуютьнаіншіречення, щогніздяться. На речення, що гніздяться, також вказує оборот “it is unwise”. Для цього речення також необхідно визначити відповідність між “it”, “him” та “bone” і “dog”. Зв'язки відповідності позначені пунктиром. Для формального запису цього речення також використовуються квантори спільності та існування і деякі елементи логіки.
Усі реляційні графи із центром у дієслові мають багато спільного. Проте серед них існують також і відмінності:
1. Вмикання контексту або його лише умовне позначення із посиланням на схемі.
2. Суворе гніздування: той самий концепт може або не може зустрічатися в двох різних контекстах, жодний із який не гніздитися в іншому.
3. Вказання зв'язків відповідності. При перехресному контексті, тобто коли той самий концепт зустрічається в двох різних контекстах, ці зв'язки не вказуються.
Проте це усього лише стилістичні розбіжності, що не впливають істотно на логіку побудови.

Внимание, отключите Adblock

Вы посетили наш сайт со включенным блокировщиком рекламы!
Ссылка для скачивания станет доступной сразу после отключения Adblock!

Скачать полную версию
Рефераты по информатике Зміст Обробка природньої мови Семантичні мережі Історична нотатка Реляційні графи Графи із центром на дієслові Пропозиційні мережі Ієрархія типів
Оценок: 267 (Средняя 5 из 5)

Специалисты RetsCorp работают в digital-сфере более 7 лет. За это время мы разработали более 500+ успешных проектов. Основываясь на своем опыте и знании рынка, мы с уверенностью можем сказать, что будет работать, а что — нет. Заказывая создание лендинга для бизнеса в нашей студии, вы получаете работающие решения, необходимые именно вашему бизнесу.

Сотрудничая с нами, вы будете не клиентом, а нашим партнером. Благодаря этому мы будем развивать ваш бизнес как собственный. Мы так же как и вы заинтересованы в успехе проекта, поскольку ваша успешность будет нашей рекламой.

© 2014 - 2022 MaxEdu.ru