Головна
Безпека життєдіяльності та охорона праці || Хімічні науки || Бізнес і заробіток || Гірничо-геологічна галузь || Природничі науки || Зарубіжна література || Інформатика, обчислювальна техніка та управління || Мистецтво. Культура || Історія || Літературознавство. Фольклор || Міжнародні відносини та політичні дисципліни || Науки про Землю || Загальноосвітні дисципліни || Психологія || Релігієзнавство || Соціологія || Техніка || Філологія || Філософські науки || Екологія || Економіка || Юридичні дисципліни
ГоловнаЕкономікаДержавне та муніципальне управління → 
« Попередня Наступна »
Нікітов В. А.. Інформаційне забезпечення державного управління / Авт.: Нікітов В. А., Орлов Є. І., Старовойтов А. В., Савін Г. І.; За ред. Ю. В. Гуляєва - М.: Слов'янський діалог,. - 415 с., 2000 - перейти до змісту підручника

Навігація в просторі гіпертексту

Навігація в гіпертекстової мережі - це чинені в процесі читання гіпертексту переходи від одного фрагмента до іншого . Вона передбачає насамперед орієнтування. Маючи перед собою фрагмент або, як прийнято говорити, перебуваючи в деякому вузлі гіпертексту, користувач повинен уявити собі його положення щодо інших вузлів. Орієнтування може бути глобальним і локальним. У першому випадку користувачеві пред'являють графічний образ мережі або її укрупнену структуру, що наочно демонструє положення даного вузла. При локальному орієнтуванні читач переглядає й оцінює інформацію про околиці даного вузла, тобто про зміст текстів, до яких можна перейти з даного фрагмента.

В ІКС необхідно передбачити різні способи пред'явлення інформації про зміст суміжних вузлів (виділення в тексті вузла відповідних слів, виклик на екран змісту або початкових частин суміжних фрагментів). На основі орієнтування користувач вибирає один з суміжних вузлів і переходить до нього (викликає відповідний фрагмент для читання). Навігація полягає в послідовності таких переходів. При цьому користувач як би переміщається в мережі від вузла до вузла. Послідовності читаних фрагментів відповідає деяка ланцюжок з'єднаних зв'язками вузлів. Кожна така ланцюжок - одна з безлічі можливих, один з маршрутів у просторі гіпертекстової мережі.

Система переходу між структурними елементами гіпертексту

Структурні елементи гіпертексту можна читати в різному порядку, слідуючи смисловим зв'язкам і відповідно матеріалізованим можливостям переходу між текстами. Система переходів в гіпертексті - це, з одного боку, смислова структура, система смислових взаємозв'язків відповідних текстів (фрагментів). З іншого - це структура, в якій кожній смислового зв'язку відповідає технічно обумовлена ??можливість перейти від тексту до тексту, тобто безпосередньо викликати для читання текст, пов'язаний з читаним в даний момент. Створення гіпертексту - це насамперед формування такої системи переходів. Коли аналітик приступає до читання, він має справу з деякою готівкової структурою гіпертексту. У процесі читання він може зробити перехід від якого-або фрагмента не до будь іншому, а лише до деяких, для яких ця можливість створена при формуванні гіпертексту. Можливість переходу викликається в тих випадках, коли фрагменти пов'язані за змістом.

Характер цього зв'язку різний: перехід може бути між текстом і коментарем до нього, між різними редакціями тексту, між текстом і його можливими продовженнями, між текстами, що відповідають або заперечують одне одному, між текстами, пересічними по змістом, перегукуються або співзвучними.

Отже, гіпертекст - це не просто система смислових зв'язків між текстами (словесно вираженими думками), а з'єднання системи таких зв'язків з технічно забезпеченої можливістю переходу по ним від тексту до тексту.

Пошук інформаційних ресурсів на Web-cepeepe

Одним із способів апріорного виявлення в Web-cepeepe релевантних7 документів є запуск Web-агента. Така програма отримує припис користувача, після чого систематично досліджує Web-сервери ІКЦ, знаходячи документи, оцінюючи їх релевантність, і повертає користувачу ранжований список документів.

Для ефективності пошуку зазвичай використовується заздалегідь створений індекс, періодично формований і оновлюваний програмами-демонамі8 Web-cepeepa. Він являє собою структуру, в якій можна шукати посилання на документи Web-cepeepa. Такий підхід більш практичний, на ньому засновані багато сучасні інструменти пошуку.

Генерація повного індексу вимагає систематичного обходу Web-вузлів і визначення місцезнаходження кожного документа. Гіпертекстова мережу аналогічна структурі орієнтованого графа, тому тут застосовні алгоритми обходу графа.

Існують три методи такого обходу:

випадковий вибір першого URL-адреси програмою-агентом для ініціалізації пошуку, а потім рекурсивний аналіз інших URL для пошуку "переважно в ширину" або "переважно в глибину";

пошук починається з набору URL-адрес, що визначаються низкою правил, а потім продовжується рекурсивно;

простір Web-сервера підрозділяється на основі відповідного класифікатора, а повне дослідження розділів виконується програмою-агентом.

Технологічні процеси обробки текстів

Індексування являє собою процес опису змісту документів і запитів в термінах інформаційно-пошукової мови, тобто мова йде про виділення в документах набору ключових слів, відображають його смисловий зміст. На його ефективність впливають два важливих параметри - повнота і точність індексування. Перша вказує, якою мірою тематика документа розпізнається системою індексування. Якщо вона забезпечує хорошу повноту, це означає, що генерується велика кількість термінів, що відображають всі аспекти тематики документа. Другий параметр характеризує специфічність термінів і визначає, наскільки широкий спектр охоплених ними понять. Пошук по більш загальним ("широким") термінам дає велике число корисних документів поряд із значною кількістю нерелевантною інформації. Це забезпечує більш високу повноту пошуку за рахунок втрати точності.

Індексування може виконуватися вручну або автоматично. Значний обсяг інформації в Web-cepeepe ІКЦ і різноманітність її тематики роблять перший варіант практично неприйнятним. Автоматичне ж індексування не вимагає наявності строго контрольованих словників і потенційно здатне відобразити більше різних аспектів документа.

Автоматичне співвіднесення змістовних термінів і документів може грунтуватися на: простих, однослівних термінах; багатослівних складових термінах (словосполученнях); статистичних теоретико-інформаційних, імовірнісних методах.

Індексування по простих термінам

Під безліччю термінів документа розуміють набір зустрічаються в ньому слів і пов'язаних з ними частотних характеристик. Слова, що виконують чисто граматичну функцію, заносяться в так звані списки виключення і видаляються.

Крім того, терміни можна "очистити", виділяючи основи слів і видаляючи суфікси.

Підходи, на основі яких присвоюється ваговій коеффіціент1 однослівним термінам, можна віднести до однієї з наступних категорій: статистичної, теоретико-інформаційної та ймовірнісної. Якщо в перших двох достатньо тільки характеристики самих документів, то імовірнісний підхід для визначення релевантності документа вимагає діалогу з користувачем.

Індексування по складовим термінам або фразами

Прості, однослівні терміни далеко не ідеальні для індексування, оскільки сенс слів поза контекстом нерідко буває неоднозначним.

Терміни-фрази більш осмислені, мають більшу дискримінуючої міццю. Для підвищення точності використовується так званий механізм генерації фрази, а для поліпшення повноти пошуку застосовується генерація тезауруса / групи.

Для генерації груп взаємопов'язаних слів по поміченим закономірностям спільного їх входження в документи застосовується метод групування або кластеризації термінів. Якщо уявити матрицю термінів-документів у вигляді двомірного масиву, то вищезгаданий метод порівнює один з одним стовпці матриці і робить висновок про те, чи входить та чи інша група термінів у кілька документів сукупності. Якщо таке має місце, то терміни вважаються пов'язаними і групуються в один клас.

Методи автоматичної генерації складних індексних термінів або фраз діляться на статистичні, імовірнісні та лінгвістичні.

Термін-фраза складається з основи фрази (зазвичай це її головна частина) і інших компонентів. Термін з частотою входження в документи, що перевищує встановлений поріг, відзначається як основа фрази. Іншими компонентами фрази повинні бути терміни з середньою або низькою частотою входження. При цьому враховується їх зв'язок з основою фрази, наприклад розміщення їх в одному реченні або на деякій заданій відстані один від одного.

Імовірнісні методи передбачають генерацію складених термінів індексу на основі інформації про залежність

ваговий коефіцієнт - число з деякого ряду чисел, що привласнюється даному в залежності від його значимості, важливості.

Термінів. Оскільки для цього потрібно розглянути експоненціальное9 число комбінацій термінів, оцінюючи для кожної ймовірності присутності в релевантних10 і нерелевантних документах, то на практиці враховуються тільки окремі пари залежних термінів. Теоретично такі залежності можуть змінюватися від користувача до користувача.

Виявлені в статистичному та імовірнісний підходах спільно зустрічаються терміни не обов'язково пов'язані семантично. Таким чином, зазначені методи далеко не завжди дозволяють отримати високоякісні одиниці індексування.

Лінгвістичні методи засновані на присвоєнні термінам індикаторів синтаксичних класів, таких, як прикметник, іменник або дієслово, облік яких дозволяє підвищити якість статичних методів. У цьому випадку формування фраз обмежується пропозиціями із заданими синтаксичними індикаторами (наприклад, существітелиюе-существи-тельное або прикметник-іменник). Для ідентифікації синтаксичних одиниць цілком застосовний простий процес синтаксичного аналізу. Елементи фраз вибираються згодом зазвичай в рамках тієї ж синтаксичної одиниці.

Дані методи генерації взаємопов'язаних термінів, як правило, вимагають електронного словника. Іноді пропонується генерувати взаємозв'язку термінів з урахуванням зворотного зв'язку з користувачем. Хоча сьогодні і розроблені різні методи автоматичної побудови тезауруса, їх ефективність поза межами тієї спеціальної середовища, де вони згенеровані, все ще залишається низькою.

« Попередня Наступна »
= Перейти до змісту підручника =
Інформація, релевантна " Навігація в просторі гіпертексту "
  1. Логічна структура гіпертексту
    простору Мережа як топологічний освіту здатна досить адекватно відображати структуру саме смислового, семантичного простору, взаємопов'язаність, відносну близькість, безпосередній або опосередкований характер зв'язку "об'єктів" в цьому просторі (змістів, елементів змісту). Для опису та аналізу систем, в яких основним ставленням виступає суміжність
  2. ТЕМА 8. КАТЕГОРІЇ ПРОСТОРУ І ЧАСУ ЯК СПОСОБИ структурування СОЦІАЛЬНОЇ РЕАЛЬНОСТІ
    простору і його роль у філософському аналізі суспільства, особистості, культури. Поняття соціального часу: особливості та евристичні можливості. Основні поняття: соціальний простір, соціальний час, соціальний континуум. Джерела та література: Кемеров В.Є., Керімов TX Xрестоматія з соціальної філософії. М., 2001. С. 233-250. Кемеров В.Є. Введення в соціальну філософію. М., 2001. С.
  3. Амстердам, 23 квітня 1619
    навігації [...]. Що ж до інших речей, якими я похвалився в попередньому листі, то вони дійсно знайдені за допомогою нових циркулей, і тут я розчарування не відчув. Але не хочу посилати Вам розрізнені уривки; з них я в один прекрасний день складу незбиране твір, який, якщо не помиляюся, буде новим і ніким не зневажаною. Але вже місяць, як я нічим не
  4. 10. Що таке простір, або внутрішнє місце
    просторі, лише в нашому мисленні. І дійсно, протяг в довжину, ширину і глибину, що утворить простір, утворює і тіло. Різниця між ними тільки в тому. що тілу ми приписуємо певне протяг, розуміючи, що воно разом з ним змінює місце щоразу, коли переміщається; простору ж ми приписуємо протяг настільки загальне і невизначене, що, видаливши з деякого
  5. Інтерпретація нелюдського
    простір. Ви можете відчувати, коли ваша собака сумує, налякана, щаслива чи голодна. І більшість людей вміє взаємодіяти з внутрішнім світом тварин. Такі люди хочуть розділити їх внутрішні почуття. Коли їх собака щаслива, вони легко розділять це щастя. Але для цього потрібно інтерпретація почуттів їх собаки. Звичайно, це не мовна або лінгвістична комунікація; але це
  6. Основна моральна інтуїція
    простору ». Я вважаю, що це справжня форма духовної інтуїції. Коли ми інтуїтивно осягаємо Дух, ми інтуїтивно осягаємо прояв Духа у всіх чотирьох секторах (бо Дух проявляється у всіх чотирьох секторах - або, простіше кажучи, як «я», «ми» і «це»). Таким чином, коли я інтуїтивно і ясно осягаю Дух, я інтуїтивно осягаю його цінність не тільки в мені самому, в моїй
  7.  З ДОСВІДУ ЛІНГВІСТИЧНОГО ВИВЧЕННЯ ТРАДИЦІЙНОГО ФОЛЬКЛОРНОГО ТЕКСТУ (СТРУКТУРА МОНО-І поліпредикативних ОДИНИЦЬ В духовному вірші Про Голубина книга) А. М. Петров
      гіпертексту. Кожен композиційний блок володіє певними специфічними рисами синтаксичної організації, які, у відповідності з природою фольклорного тексту, варіюються в різних версіях. Всі композиційні блоки, крім першого та шостого, мають діалогічне будова. Тому в якості основної структурної одиниці цього тексту ми вичленяємо інформативне (директивне) діалогічне
  8.  5. Дисертації та автореферати
      простору як сукупності інформаційних відносин: Дис. ... канд. юрид. наук. Єкатеринбург, 2003. Грибанов Д.В. Правове регулювання кібернетичного простору як сукупності інформаційних відносин: Автореф. дис. ... канд. юрид. наук. Єкатеринбург, 2003. Макарова Е.М. Проблеми правового регулювання використання Інтернету у підприємницькій діяльності: Дис. ...
  9.  § 27. Смисложиттєві цінності.
      просторі цінностей, в якому об'єктивно обертається кожне «Я» і з якого воно «вихоплює» ті чи інші фрагменти для оціночної ревізії свого існування, тобто для його осмислювання. Ми не будемо обговорювати проблему цінностей взагалі, це предмет самостійного дослідження. У даній роботі ми будемо розуміти під цінностями такі орієнтири життєдіяльності людини, які виступають
  10.  Цілі і завдання об'єкта управління ресурсами регіону як інформаційної системи
      навігація по сховищу даних з метою генерації нерегламентованих запитів і представлення результатів у вигляді різних звітів, а також, у разі необхідності, відображення їх через інформаційний інтерфейс на топологічної основі; багатовимірний аналіз даних, що дозволяє організувати агрегированную інформацію зі сховища у вигляді моделі і забезпечити її зручний перегляд та аналіз, включаючи
  11.  Людина, яка піднімається вгору
      навігація. Немає необхідності заглиблюватися в цю тему, але я можу просто згадати про те, що «навігація», наприклад, пов'язана з чотирма рушійними силами, які є у кожного холону, в тому числі і холону «я», а саме, організація та взаємодія, самопреодоленіе і самораспад (регрес). На кожному ступені розвитку особистості у нього є ці чотири основні можливості вибору шляху, яким
  12.  33. Чому при всякому русі повинен бути коло, або кільце, спільно рухомих тіл
      просторі EFGH (рис. 4), може рухатися по колу, причому 365 частинка, яка перебуває при Е, переходить до G, а та, яка знаходиться у G, переходить в той же час до Е; при цьому немає потреби припускати ні згущення, ні порожнечі, аби простір G, яке, як ми припускаємо, в чотири рази більше простору Е і вдвічі більше просторів F і Н, передбачалося рухомим до E в чотири
  13.  На шляху до глобального: частина 1
      простору - це одне, а картограф, здатний накреслити таку карту, - зовсім інше. Глобальна перспектива не є природженою; немовля не народжується з нею; у людиноподібних мавп її також не було. Глобальна перспектива - це рідкісна, елітна, незвичайна точка зору дуже великої глибини, і існує відносно небагато людей, які дійсно мають доступ до цієї глибині (чим
  14.  Глибина і ширина
      простір з глибиною. І більшість думає, що великий розмір означає велику глибину, а все абсолютно навпаки. У: Так що у вашій теорії означають «глибина» і «простір»? КУ: Число рівнів в будь холархіі називається глибиною, а число холонів на кожному рівні називається шириною. У: Значить, якщо ми говоримо, що атоми мають глибину один, тоді молекули повинні мати
  15.  І.М. Розсолу. ПРАВО ТА ІНТЕРНЕТ / ТЕОРЕТИЧНІ ПРОБЛЕМИ / 2-е видання, доповнене, 2009

  16.  Культура і соціум
      простором. КУ: Якщо свідомість є глибина і глибина існує скрізь на шляху вниз, то загальна, або громадська, глибина також існує скрізь на шляху вниз, культура існує скрізь на шляху наростання глибини. У: Вибачте? КУ: Іншими словами, якщо холони мають спільну зовнішню сторону, вони мають і загальну внутрішню сторону. У: Їх «культуру», як ви це називаєте.
  17.  СУЧАСНІ СОЦІОЛОГІЧНІ КОНЦЕПЦІЇ РОЗВИТКУ СВІТОВОЇ ЦИВІЛІЗАЦІЇ, ПОЛІТИКИ ТА ЕКОНОМІЧНИХ РЕФОРМ
      простору, національних традицій і менталітету, науки, людського фактора на формування конкретних програм і моделей сучасного суспільного устрою. Теорія конвергенції традиційних форм розвитку і проблема «третього
  18.  3. Рух і його основні форми. Простір і час.
      простір тісно переплетені між собою. Те, що відбувається в просторі, відбувається одночасно і в часі, а те, що відбувається в часі, перебуває в просторі. В історії філософії і науки склалися дві основні концепції простору і часу: Субстанціальні концепція розглядає простір і час як особливі самостійні сутності, які існують поряд і незалежно
  19.  13. Що таке зовнішнє місце
      простір "не позначають нічого дійсно відмінного від тіла, про яке говорять, що воно« займає місце »; ними позначаються лише його величина, фігура і положення серед інших тіл. Щоб визначити це положення, ми повинні помітити деякі інші тіла, які вважаємо нерухомими, але так як ми помічаємо різні тіла, то можемо сказати, що одна і та ж річ в один і той же час і
  20.  «Кипляча всесвіт» соціальних груп
      просторі і роблять це простір звичним середовищем проживання. Руйнування культури, таким чином, виступає прямої, безпосередньої соціальної причиною (і одночасно проявом) руйнування соціальної структури. Цей висновок стосується насамперед «культурних консервів», за висловом Я. Морено, тобто соціальних правил, норм, поведінкових зразків, традиційних цінностей. «Нормальна»,