Інформаційно-аналітичні технології

Автор работы: Пользователь скрыл имя, 10 Января 2014 в 13:11, практическая работа

Краткое описание

Будь-яка діяльність людини базується на інформації. Однією з головних проблем, що виникає при задоволенні інформаційних потреб людства є проблема пошуку інформації. Все більше ускладнюється пошук інформації в мережі Internet. Це відбувається внаслідок вражаючого зростання обсягів і темпів росту web-ресурсів мережі. Так, за результатами дослідження компанії Netcraft, у 1998 році кількість серверів у мережі Internet становила 1 млн. Згідно з даними експертів компанії Inktomi, на лютий 2000 року їх нараховувалося вже понад 6 млн. Загальна кількість web-сторінок на серверах Internet перевищує мільярд.

Прикрепленные файлы: 1 файл

proekt_по_ИАТ_магистри.doc

— 459.00 Кб (Скачать документ)


СХІДНОЄВРОПЕЙСЬКИЙ УНІВЕРСИТЕТ  ЕКОНОМІКИ І МЕНЕДЖМЕНТУ

 

 

 

 

 

 

 

 

 

 

ПРОЕКТНА РОБОТА

 

 

НА ТЕМУ:

 

 

„Інформаційно-аналітичні технології”

 

 

 

 

 

 

 

 

Виконали:

 

Перевірила:

 

 

 

 

 

 

 

 

 

 

 

Черкаси 20___

 

ЗМІСТ

 

 

ВСТУП

Будь-яка діяльність людини базується на інформації. Однією з  головних проблем, що виникає при  задоволенні інформаційних потреб людства є проблема пошуку інформації. Все більше ускладнюється пошук  інформації в мережі Internet. Це відбувається внаслідок вражаючого зростання обсягів і темпів росту web-ресурсів мережі. Так, за результатами дослідження компанії Netcraft, у 1998 році кількість серверів у мережі Internet становила 1 млн. Згідно з даними експертів компанії Inktomi, на лютий 2000 року їх нараховувалося вже понад 6 млн. Загальна кількість web-сторінок на серверах Internet перевищує мільярд.

Швидкий та інтенсивний  розвиток мережі Internet сприяв виникненню ряду парадоксів, основний з яких полягає в тому, що зростання в декілька разів обсягів в мережі Internet призводить одночасно не тільки до ускладнення знаходження дійсно необхідної інформації, а й до активізації розробки, впровадження та використання систем та технологій пошуку.

Тобто, корисних даних  у мережі все більше, але знайти їх все складніше.

Зараз навіть при застосуванні найдосконаліших методів організації  пошукових запитів потужні пошукові системи видають часом сотні, а іноді й тисячі посилань. У  цих випадках високий рівень інформаційного шуму (тобто документів формально релевантних, але не відповідних інформаційним потребам користувача) робить наявні механізми пошуку малоефективними.

Виникає ряд питань: як конкретному користувачу Internet знайти та відібрати необхідні йому дані, якими пошуковими системами доцільніше користуватися під час пошуку інформації, що стосується певної проблеми, які технології пошуку є більш ефективними під час пошуку інформації з певної проблеми, до яких інформаційних ресурсів доцільніше звертатися, щоб отримати більш повну і точну інформацію?

Спробуймо дати відповіді  на питання такого характеру щодо пошуку інформації за загальним тематичним напрямом „Інформаційні системи”, який включає в себе наступні підтеми:

  • Фінансово-економічні інформаційні системи,
  • Інформаційні системи та технології в бізнесі,
  • Інформаційні системи та технології в менеджменті,
  • Інформаційні системи та технології в менеджменті в галузі охорони здоров’я

Отже, мета роботи полягає  у дослідженні особливостей пошуку та виробленні власних рекомендацій щодо здійснення більш ефективного пошуку з даної тематики.

Мета роботи реалізується в процесі виконання таких  завдань:

  1. охарактеризувати призначення та основні і можливості ІПС,
  2. провести класифікацію ІПС щодо їхніх функціональних можливостей та результативності пошуку на задані тематичні запити,
  3. провести оцінку релевантності інформації, знайденої в конкретних пошукових системах на конкретні запити,
  4. провести оцінку якості пошуку інформації в конкретних пошукових системах на конкретні запити,
  5. провести оцінку результатів розширеного пошуку за тематичним напрямом,
  6. провести оцінку пошуку інформації за тематичними напрямами в обраних ІПС при використанні синтаксису мови запитів систем,
  7. провести класифікацію знайдених інформаційних ресурсів та виділити з поміж них ті, які є найбільш інформативними.

Для проведення роботи з  пошуку інформації за заданими тематиками обрано наступні ІПС:

Фінансово-економічні інформаційні системи:

  • Яndex (http://www.yandex.ru),
  • Google (http://www.google.ru).

Інформаційні  системи і технології в менеджменті  в галузі охорони здоров’я:

  • Mail.ru (http://www.mail.ru),
  • Yahoo! (http://www.yahoo.com).

Інформаційні  системи та технології в бізнесі

  • Апорт (http://www.aport.ru),
  • Rambler (http://www/rambler.ru),

Інформаційні  системи та технології у менеджменті

  • Alta Vista (http://www.altavista.com),
  • Info Seek (http://www.infoseek.com).

 

1. Класифікація пошукових  систем

Вирішення великої кількості  інформаційних задач залежить від  якості результатів інформаційного пошуку — вибору з усієї відомої сукупності документів, текстів, відомостей, фактів і даних тих елементів, які відповідають інформаційним потребам. За умов великих обсягів інформації, серед якої здійснюється пошук, стає доцільним і навіть необхідним використання інформаційно-пошукових систем.

Інформаційно-пошукова система — це сукупність методів і засобів, призначених для зберігання та пошуку документів, відомостей про них чи певних фактів.

За тематикою виділяють галузеві ІПС, полі- та вузькотематичні. Залежно від типу інформації, що зберігається, розрізняють документальні системи, в яких об'єктом зберігання і пошуку є документ, та фактографічні, в яких зберігаються і розшукуються окремі дані, що характеризують деякі факти — події, процеси, явища.

За режимом функціонування виокремлюють:

  • системи з вибірковим пошуком — ІПС, в яких пошук виконується за постійним набором запитів для певного контингенту користувачів у масиві поточних надходжень документів чи даних, які надходять через певні інтервали часу. При цьому змінюється вміст системи, а запити залишаються без змін;
  • системи з ретроспективним пошуком, які обслуговують разові запити, що змінюються залежно від інформаційних потреб користувачів, у нагромадженому інформаційному фонді зі значною хронологічною глибиною.

Інформаційно-пошукові системи  поділяються на два основні види:

  • пошукові системи, призначені для пошуку ресурсів Інтернет за ключовими словами, які визначає користувач. Пошук здійснюється у спеціальній базі даних, що містить індекси пошукової системи — терміни, які описують зміст ресурсів Мережі. Шукає ресурси, переглядає їх і приписує їм терміни спеціальна програма— робот-індексувальник, якого називають спайдером (від англ. „spider” — павук) або кроулером (від англ. “crawler” — плазун). База індексів пошукової системи постійно оновлюється. Кожна пошукова система має власний особливий спайдер і специфічний спосіб пошуку даних у базі індексів, а тому результати пошуків у відповідь на один і той самий запит у різних пошукових системах можуть бути істотно різними. Класичним прикладом пошукових систем є Alta Vista, Mail.ru, Info Seek, Rambler, Yandex, Google.
  • каталоги, які також пропонують користувачеві можливості щодо пошуку потрібних ресурсів, але не за допомогою ключових слів, а вручну за ієрархічно організованими тематичними рубриками. Королем каталогів вважається Yahoo! Зауважимо, що нині дедалі більше пошукових служб поєднують у собі елементи пошукових систем і каталогів — користувач сам вибирає спосіб пошуку;

Окрім вказаних вище основних систем, існують також так звані ініціювальні сервери, які не лише здійснюють пошук, а й надають комплекс додаткових послуг своїм користувачам. Збільшення кількості ініціювальних серверів є ще однією тенденцією розвитку пошукових служб Інтернет. Найбільші сервери такого роду дістали назву порталів.

 

Інформаційно-пошукова система Яndex. У даний час – одна із найкращих пошукових систем Росії. На початок 2005 року декларує індексацію більше 1,6 мільйонів російських і зарубіжних російськомовних серверів, а також серверів на території колишнього СРСР (всього близько 380 мільйонів оригінальних документів). Володіє розгорнутою системою формування запиту. Зокрема, допускається введення пошукового розпорядження на природній мові - в цьому випадку всі необхідні розширення проводяться автоматично. Більш детальний запит може бути складений за допомогою режиму "Розширений пошук" (знак +), в якому застосовується система багатоступінчатих меню.

У Яндекса достатньо  швидкий пошуковий робот, після 2-4 годин зареєстрована сторінка з'являється  в пошукових результатах.

В системі Яндекс існує  спеціальна мова запитів, використовувати яку складніше, ніж форму розширеного пошуку, але при її використанні можна одержати найкращий результат.

Пошук в Yandex працює тільки за повними словами, а також з  урахуванням морфології російської мови: він розуміє слово у всіх його граматичних формах і з урахуванням цього Yandex здійснюватиме пошук.

Багата мова запитів  підтримує всі логічні операції в межах документа або пропозиції, дозволяє враховувати відстань між  словами, пошук в заданих зонах  або з урахуванням заданих  атрибутів документа. Список виданих документів може бути впорядкований по релевантності, даті або іншим документним атрибутам. В кожному знайденому документі можуть бути виділені (підсвічуванням) знайдені слова.

 

Інформаційно-пошукова система Google. Найбільша пошукова система Інтернету. Обслуговує більше 70% всіх пошукових запитів в світі. База даних Google має вражаючі розміри – більше 4 млрд. проіндексованих сторінок у всьому світі на десятках мов. Має оригінальні параметри для оцінки відповідності ключових слів пошуковому запиту, серед яких виділяється своєю важливістю і значущістю, розроблений фахівцями пошукової системи Google алгоритм обліку зовнішніх посилань на сторінку під назвою PageRank (PR).

Google на сьогодні є  абсолютним світовим лідером  за об'ємом проіндексованих документів, швидкістю обробки запиту і коректністю ранжування результатів пошуку. Весь інтерфейс виконаний на російській мові. Також є кращою пошуковою системою для виявлення ілюстрацій. Англомовний варіант забезпечений довідником ресурсів Інтернет. На даний момент в базу даних пошукової системи занесено близько 13 мільйонів файлів PDF.

Google – одна  з небагатьох пошукових систем, яка глибоко індексує сайти  (тобто вона намагається "пройтись" по всіх посиланнях сайтів). Google вважає, що наступні чинники будуть найвагомішими при ранжуванні сторінок:

· Link popularity (індекс цитування)

· Keyword proximity and density (густина і частота ключових слів)

· Keywords in link text (ключові слова в посиланнях)

· Emphasized text (виділений текст)

При видачі в списку результатів видається: посилання на сторінку, опис, складений із слів, які оточують пошуковий запит. Оскільки опис сторінки залежить від конретного пошукового запиту, то це можна використовувати.

Google має дуже багато  різних пошукових функцій, особливо в розділі розширений пошук: булевий пошук (часткова підтримка булевих команд: AND (+), OR, NOT (-). Google автоматично шукає всі слова введені в полі запиту; пошук по фразах (фраза виділяється лапками. "новини зі всього світу"); пошук по близькості (оператор NEAR не доступний ); пошук по складу слова (не підтримується ); регістр букв (Google не чутливий до регістру); пошук на різних мовах; Field Search; Google.

 

Інформаційно-пошукова система Апорт. Однією з суттєвих переваг Апорту є англо-російський і російсько-англійський переклад в режимі on-line запитів і пошуків результату, дякуючи чому можна вести пошук в російських ресурсах Internet, навіть не знаючи російської мови. Дякуючи ряду унікальних особливостей системи, можна шукати інформацію, використовуючи вирази, навіть для речень.

Серед основних властивостей системи Апорт можна виділити наступні:

  • переклад запиту і результатів пошуку з російської на англійську мову і навпаки;
  • автоматична перевірка орфографічних помилок запиту;
  • інформативний вивід результатів пошуку для знайдених сайтів;
  • можливість пошуку в будь-якій граматичній формі (що важливо для російської мови);
  • висока якість розширених запитів для професійних користувачів.

 

Інформаційно-пошукова система Rambler. Ця російськомовна пошукова служба має гарні можливості пошуку. Розділи, перераховані на домашній сторінці Rambler детально висвітлюють російськомовні Web ресурси. В разі, якщо користувачу необхідно працювати в специфічній області, йому слід використати запропоновану класифікацію інформації. Зручною можливістю роботи на Rambler є представлення списку найбільш відвідуваних сайтів за кожною запропонованою тематикою.

Стандартні засоби пошуку дозволяють оперувати безпосередньо  з рядка «Поиск», розміщеного  у верхній частині сторінки Rambler.

 

Інформаційно-пошукова система Alta Vista. Здійснює пошук за Web-сторінками та Usenet. За допомогою цієї пошукової системи можна знайти що завгодно та де завгодно, так як ця система здійснює міжнародний пошук та є англомовною. Але слід відзначити, що формулювати запит необхідно дуже точно, тому що у іншому разі буде видано у відповідь багато „інформаційного сміття”. Пошук у цій системі можна здійснювати як за простим запитом, так і за розширеним, а також за допомогою синтаксису мови запитів.

Info Seek Здійснює пошук у Web, UseNet (система телеконференцій) та FAQ (за питаннями, що дуже часто ставляться користувачами), за поточними новинами, електронними адресами, картами і списками компаній. Вміщує довідкову пошукову систему і каталог, який є корисним, в тому разі, коли необхідно здійснити пошук у Web, UseNet. Пошук у цій системі можна здійснювати як за простим запитом, так і за розширеним, а також за допомогою синтаксису мови запитів.

 

Інформаційно-пошукова система Yahoo! Пошукова система Yahoo зародилася як проста колекція закладок. На сьогоднішній день Yahoo, це вже не просто каталог, це ціла група різноманітних сервісів, серед яких такі як каталог Yahooligans - Yahoo для дітей, система персональних каналів My Yahoo, безкоштовний E-mail сервіс, система "Shop with Yahoo" (купуйте з Yahoo), сумісний з MTV проект MTV unfURLed і багато що інше.

Информация о работе Інформаційно-аналітичні технології