Автоматизированные информационные системы

Автор работы: Пользователь скрыл имя, 21 Ноября 2013 в 16:15, реферат

Краткое описание

В 21 веке развитие информационных технологий обусловило переход человеческого сообщества от индустриального к постиндустриальному, или как ещё его называют, информационному. В частности, это проявляется в всё более возрастающем и повсеместном внедрении в нашу жизнь компьютерных. Особое месте в жизни почти каждого жителя нашей планеты Земля занимает World Wide Web – паутина, в сетях который мы крутимся каждый день. В особенности нас привлекает возможность найти информацию практически любой сферы интересов. И в этом нам помогаю автоматизированные информационно-поисковые системы (АИПС). Именно о них я и хотел написать в своём реферате в рамках озвученной темы.

Содержание

Введение 3
Понятие автоматизированных информационных поисковых систем 4
Как работает поисковая система Google. 5
Как работает поисковая система Яндекс 7
Заключение 9
Список использованной литературы 10

Прикрепленные файлы: 1 файл

реферат конец.docx

— 31.02 Кб (Скачать документ)

Автоматизированные информационные системы

ПРИДНЕСТРОВСКИЙ ГОСУДАРСТВЕННЫЙ  УНИВЕРСИТЕТ

им. Т.Г. Шевченко

Юридический факультет

 

 

 

 

Реферат

по предмету: «Информационные технологии в юридической деятельности»

на тему: «Автоматизированные информационные системы»

 

 

 

 

 

 

 

 

 

Выполнил: студент 2-го курса 203 группы

очного отделения

специальность «юриспруденция»

Мкртчян Эдвард Араикович

 

Рецензент: ст. пр. Е.В. Соломатина

 

 

 

Тирасполь, 2013 г.

 

Оглавление

Введение 3

Понятие автоматизированных информационных поисковых систем 4

Как работает поисковая система Google. 5

Как работает поисковая система Яндекс 7

Заключение 9

Список использованной литературы 10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Введение

В 21 веке развитие информационных технологий обусловило переход человеческого  сообщества от индустриального к  постиндустриальному, или как ещё  его называют, информационному. В  частности, это проявляется в  всё более возрастающем и повсеместном внедрении в нашу жизнь компьютерных. Особое месте в жизни почти  каждого жителя нашей планеты  Земля занимает World Wide Web – паутина, в сетях который мы крутимся каждый день. В особенности нас привлекает возможность найти информацию практически любой сферы интересов. И в этом нам помогаю автоматизированные информационно-поисковые системы (АИПС). Именно о них я и хотел написать в своём реферате в рамках озвученной темы.

Интернет, как мировая  всеобъемлющая сеть существует относительно недавно, всего несколько десятилетий. Но за этот короткий срок среди АИПС появились лидеры. Это такие поисковые  системы, как Google и Yandex. И в качестве примера именно на изучении их  работы я подробно хотел остановиться в своей работе.

Таким образом информация в реферате будет носить больше практический, чем теоретический характер, что  сегодня, на мой взгляд, более актуально  и полезно для современного пользователя сети Интернет.

 

 

 

 

 

 

Понятие автоматизированных информационных                         поисковых систем

Для начала необходимо определить такие понятия, как информационная система, автоматизированная информационная система (АИС) и автоматизированная информационно-поисковая система (АИПС) для более чёткого понимая  предмета

Информационная система (ИС) – это структурированная совокупность программно–технических и прочих вспомогательных средств, технологических процессов, которые обеспечивают сбор, представление и накопление информационных ресурсов, поиск и выдачу сведений, которые необходимы для удовлетворения информационных потребностей информационных пользователей .

Автоматизированная информационная система (АИС) - комплекс автоматизированных информационных технологий, составляющих ИС, предназначенную для информационного обслуживания потребителей.

Автоматизированная информационно-поисковая система (АИПС) – программный продукт, предназначенный для реализации процессов ввода, обработки, хранения, поиска, представления данных т.п.

 

 

 

 

 

 

 

Как работает поисковая система Google

 

  Пришла очередь самой  известной поисковой системы. Без  понимания того, как она работает, трудно не только добиться успеха в поднятии рейтинга своего сайта, но и жить вообще.  

Тремя ключевыми процессами для Google, позволяющими поисковой системе  выдавать наиболее соответствующие  поисковым запросам результаты, являются следующие:

  1. Сканирование
  2. Индексация
  3. Обработка

Рассмотрим подробно каждый из них.

Сканирование  

Сканирование - это процесс, во время которого роботы Google обнаруживают новые и обновленные страницы для добавления в свою базу. Google использует огромное количество компьютеров, чтобы извлечь «просканировать» миллиарды страниц в Интернете.

Программа, которая делает выборку, называется «Googlebot» (также известна как робот, бот или паук). Googlebot использует алгоритмический процесс: компьютерные программы, определяют какие сайты сканировать и как часто, и сколько страниц проиндексировать из каждого сайта.

Процесс сканирования Google начинается со списка URL-адресов(адрес сайта в интернете) веб-страниц, полученных от предыдущего сканирования и дополненных данными карты сайта, предоставляемыми вебмастерами. Когда Googlebot посещает каждый из этих сайтов, он  обнаруживает ссылки на другие страницы и добавляет их в список страниц, подлежащих сканированию.

Новые сайты со временем переходят  в статус существующих, «мертвые» (т.е. не ведущие никуда) ссылки выявляются и данные используется для обновления индекса (базы данных) Google. Google не принимает плату за то, чтобы сканировать чей-то сайт чаще: они предпочитают держать отдельно поисковый сервис от своих приносящих доход услуг AdWords (рекламные услуги). 

 

Индексация 

Индексация – процесс обработки роботом Google каждой из страниц, на которую он заходит, в целях формирования массивных баз данных из всех слов, которые он распознает и расположения этих слов на каждой из страниц. Кроме того, Google обрабатывает информацию, расположенную в ключевых тегах и атрибутах, таких как title тегах(Определяют заголовок документа) и атрибутах alt(устанавливает альтернативный текст для изображений).

Googlebot может обрабатывать многие, но не все типы контента(информационное наполнение сайта). Например, они не могут обрабатывать содержание некоторых насыщенных мультимедийных файлов или динамических страниц. 

Обработка. 

Обработка наступает в момент, когда пользователь вводит поисковый запрос, тогда поисковая система заходит в свою базу данных (индекс) для подбора наиболее соответствующих запросу страниц и возвращается с результатами, которые являются наиболее соответствующими для пользователей.

Соответствие определяется с помощью  более, чем 200 факторов, одним из которых  является PageRank (PR) данной страницы. PR - это мера важности страницы на основе входящих ссылок с других страниц. Проще говоря, каждая ссылка на страницу вашего сайта с другого сайта, добавляет PageRank вашему сайту.

Не все ссылки равны: Google работает над улучшением условий работы пользователей  путем выявления спам-ссылок и  других методов, которые негативно  влияют на результаты поиска. Лучшими  ссылками считаются те, которые даны, основываясь на качестве контента.

Для того, чтобы ваш сайт занял хорошее место в результатах  поиска страницы, важно убедиться, что Google может беспрепятственно и верно сканировать и индексировать ваш сайт.

 

 

 

 

 

 

Как работает поисковая система Яндекс

Работа поисковой системы Яндекс представляет собой работу поисковых роботов, которые переходя по прямым ссылкам, индексируют сайты, сохраняя странички к себе в базу. Эти поисковые роботы никогда не переходят по редиректным ссылкам (специальное перенаправление), переходить по таким ссылкам они не умеют. Странички они к себе закачивают не полностью, они не видят скриптов (программный код), картинок, флеш-анимаций. Вместо самой картинки, Яндекс будет видеть только ее название в виде html кода.

Поисковые роботы бывают двух типов: обычные роботы и быстрые роботы. Как узнать каким роботом проиндексирована страница? Узнать это можно довольно просто:

Если в результатах поиска около  страницы (сайта) возле фразы «сохраненная копия» есть надпись «5 часов назад», это значит, что на нее заходил быстрый робот. При этом страница, которая проиндексирована пока что еще только быстрым роботом в результатах поиска может еще не участвовать и может выпасть из индекса. Так что нужно дождаться пока на сайт не зайдет обычный робот и не проиндексирует вашу страницу.

Яндекс выстраивает сайты в определенном порядке. На что он опирается при построении выдачи? Существуют три основных фактора.

  1. Текстовая составляющая - частота ключевого слова.

То есть, если мы введем в  поисковике слово «квартиры», Яндекс выстроит сайты с учетом частоты количества слов "квартиры" в тексте. 
Условно можно предположить, что в тексте сайта, стоящего на первом месте, будет чаще встречаться слово "квартиры", чем на сайте, стоящем на более низком месте. Почему условно можно предположить, потому что это не значит, что если сайт на первой позиции, то в его контенте больше ключевых слов. Просто у такого сайта, допустим, может быть большой вес и он просто перекрывает большее количество ключевиков на сайте стоящем ниже, то есть его вес играет значительно большую роль, чем количество ключевых слов другого более слабого по весу сайта но с большим количеством ключевиков.

 

  1. Ссылочное ранжирование.

Чем больше внешних  ссылок на сайт, тем выше он в поисковой  выдаче. Также большое значение имеет авторитетность сайта, который на вас ссылается. То есть одна ссылка с авторитетного сайта может заменить, к примеру, тридцать ссылок со слабых сайтов. 
Яндекс так и думает, что если этот сайт А ссылается на сайт В, то значит на сайте В есть что-то интересное, и должно быть оно будет полезно посетителям, значит надо его поднять в поисковой выдаче. Следовательно чем выше в глазах поисковика сайт, тем больший эффект даст ссылка с него.

  1. Вес сайта.

К сожалению, нет такого показателя веса сайта, но есть некоторые, косвенные признаки, по которым мы можем определить насколько весомый сайт или страница. Так вот существуют такие показатели или тематический индекс цитирования - ТИЦ, придуманный поисковой системой Яндекс. И придуманный - google pagerank PR. 
Условно можно предположить, что чем больше эти показатели, тем больший вес сайт имеет, если у ресурса большой ТИЦ, то на него стоит много ссылок, значит сайт имеет большой вес. Также по PR можно предположить, что если страница имеет не нулевой PR, то эта страница весома.

Заключение

В своей работе я постарался максимально познавательно и  лаконично изложить наиболее актуальный материал, касающийся наиболее популярных информационно-поисковых систем, с  которыми мы встречаемся каждый день. Не нужно говорить о том, что каждый обязан владеть навыком обращения  с данными системами – сегодня это необходимость. Тяжело переоценить их полезность в современном динамично развивающемся обществе, где необходимо обрабатывать огромный массив информации каждому человеку каждый день. В связи с насущностью освещённой темы считаю исключительно важным её раскрытие и донесение до широкого круга пользователей.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Список  использованной литературы:

  1. Н.А. Гайдамакин  Автоматизированные информационные системы, базы и банки данных. Вводный курс - Гелиос АРВ, Москва, 2002

 

Материалы сайтов:

  1. http://inftis.narod.ru/it/5-6/n14.htm
  2. http://www.baxtop.ru/kak-rabotaet-yandex.htm
  3. http://vsemproblemam.net/seo/kak-rabotaet-poiskovaja-sistema-google.html

 

Мкртчян Эдвард 203 группа


Информация о работе Автоматизированные информационные системы