Индивидуальное задание по дисциплине Компьютерные сети
и коммуникации
Выполнил студент Группы MO 05-2 Заозёрный Евгений
Национальный горный университет
Днепропетровск 2006г.
В
Сети существует большое число сервисов. Нас в дальнейшем будет интересовать WWW
или просто Web (Word-Wide Web- всемирная паутина). Это самый популярный сервис
Сети и удобный способ работы с информацией. Сегодня существует по меньшей мере
30 тыс. серверов WWW. Именно за счет WWW Сеть растёт так стремительно.
Пользуясь
несложным языком описания, можно составлять гипермедийные документы для их
последующей публикации в Сети (под гипермедийным я подразумеваю документ,
который может содержать все виды информации от простого текста до
мультимедийных роликов). Чтобы увидеть содержание документа так, как его
представляет себе его автор нужно иметь на компьютере клиенте программу
просмотра браузер.
Раздел 1
Введение
INTERNET
глобальная компьютерная сеть, охватывающая весь мир. Сегодня INTERNET имеет
около 15 миллионов абонентов в более чем 150 странах мира. Ежемесячно размер
сети увеличивается на 7 10%. INTERNET образует как бы ядро, обеспечивает
связь различных информационных сетей, принадлежащих различным учреждениям во
всём мире, одна с другой.
Если
ранее сеть использовалась исключительно в качестве среды передачи файлов и
сообщений электронной почты, то сегодня решаются более сложные задачи
распределеного доступа к ресурсам. Около двух лет назад были созданы оболочки,
поддерживающие функции сетевого поиска и доступа к распределенным информационным
ресурсам, электронным архивам.
Internet,
служившая когда-то исключительно исследовательским и учебным группам, чьи
интересы простирались вплоть до доступа к суперкомпьютерам, становится все
более популярной в деловом мире.
Компании
соблазняют быстрота, дешевая глобальная связь, удобство для проведения
совместных работ, доступные программы, уникальная база данных сети Internet.
Они рассматривают глобальную сеть как дополнение к своим собственным локальной
сетям.
При
низкой стоимости услуг пользователи могут получить доступ к коммерческим и
некоммерческим информационным службам США, Канады, Австралии и многих
европейских стран. В архивах свободного доступа сети Internet можно найти
информацию практически по всем сферам человеческой деятельности, начиная с новых
научных открытий до прогноза погоды на завтра.
Кроме
того Internet предоставляет уникальные возможности дешевой, надежной и
конфиденциальной глобальной связи по всему миру. Это оказывается очень удобным
для фирм имеющих свои филиалы по всему миру, транснациональных корпораций и
структур управления. Обычно, использование инфраструктуры Internet для
международной связи обходится значительно дешевле прямой компьютерной связи
через спутниковый канал или через телефон.
Электронная
почта самая распространенная услуга сети Internet. В настоящее время свой
адрес по электронной почте имеют приблизительно 20 миллионов человек. Посылка
письма по электронной почте обходится значительно дешевле посылки обычного
письма. Кроме того сообщение, посланное по электронной почте дойдет до адресата
за несколько часов, в то время как обычное письмо может добираться до адресата
несколько дней, а то и недель. В настоящее время Internet испытывает период
подъема, во многом благодаря активной поддержке со стороны правительств европейских
стран и США.
1.История сети INTERNET
В
1961 году Defence Advanced Research Agensy (DARPA) по заданию министерства
обороны США приступило к проекту по созданию экспериментальной сети передачи
пакетов. Эта сеть, названная ARPANET, предназначалась первоначально для
изучения методов обеспечения надежной связи между компьютерами различных типов.
Многие методы передачи данных через модемы были разработаны в ARPANET. Тогда же
были разработаны и протоколы передачи данных в сети TCP/IP. TCP/IP это множество
коммуникационных протоколов, которые определяют, как компьютеры различных типов
могут общаться между собой.
Эксперимент
с ARPANET был настолько успешен, что многие организации захотели войти в нее, с
целью использования для ежедневной передачи данных. И в 1975 году ARPANET
превратилась из экспериментальной сети в рабочую сеть. Ответственность за
администрирование сети взяло на себя Defence Communication Agency (DCA), в
настоящее время называемое Defence Information Systems Agency (DISA). Но
развитие ARPANET на этом не остановилось; Протоколы TCP/IP продолжали
развиваться и совершенствоваться.
В
1983 году вышел первый стандарт для протоколов TCP/IP, вошедший в Military
Standarts (MIL STD), т.е. в военные стандарты, и все, кто работал в сети,
обязаны были перейти к этим новым протоколам. Для облегчения этого перехода
DARPA обратилась с предложением к руководителям фирмы Berkley Software Design
внедрить протоколы TCP/IP в Berkeley(BSD) UNIX. С этого и начался союз UNIX и
TCP/IP.
Спустя
некоторое время TCP/IP был адаптирован в обычный, то есть в общедоступный
стандарт, и термин Internet вошел во всеобщее употребление. В 1983 году из
ARPANET выделилась MILNET, которая стала относиться к Defence Data Network
(DDN) министерства обороны США. Термин Internet стал использоваться для
обозначения единой сети: MILNET плюс ARPANET. И хотя в 1991 году ARPANET
прекратила свое существование, сеть Internet существует, ее размеры намного
превышают первоначальные, так как она объединила множество сетей во всем мире.
Диаграмма 1 иллюстрирует рост числа хостов, подключенных к сети Internet с 4
компьютеров в 1969 году до 3,2 миллионов в 1994. Хостом в сети Internet
называются компьютеры, работающие в многозадачной операционной системе (Unix,
VMS), поддерживающие протоколы TCPIP и предоставляющие пользователям
какие-либо сетевые услуги.
2. Что такое Интернет
Internet
– это обширная, разветвленная сеть, объединяющая компьютеры, расположенные в
самых отдаленных точках Земли. Оценить размеры этой глобальной паутины сетей
невозможно. Согласно некоторым источникам Internet охватила более 100 стран и
объединила 50 тыс. отдельных сетей; к Internet подключены более пяти млн.
компьютеров и зарегистрировано более 30 млн. пользователей! Авторы последних
обзоров попытались оценить размеры сети, посылая запросы на серверы. Результаты
таковы: в Internet активно работают примерно 22 млн. пользователей, среди них
поставщики услуг и абоненты, использующие такие средства, как Mosaic, Telnet и
FTP2. Конкретные цифры различаются между собой, и это неудивительно. Легко
попасть в затруднение, когда новые данные о росте Internet появляются почти так
же быстро, как и новые серверы. Но если мы точно не знаем, какое количество
людей пользуется Internet, то, по крайней мере, точно знаем его историю. В 1985
г. Internet включала в себя приблизительно 100 сетей. К 1989 г. их число
увеличилось до 500. В январе 1990 г. были зарегистрированы 2218 сетей,
связанных между собой. В июне 1991 г. NSFNIT (National Science Foundation
Network Information Center – Центр сетевой информации Национального научного
фонда США) оценил количество сетей на уровне четырёх тысяч, с тех пор размеры
сети увеличились более чем в десять раз. Если экстраполировать эти цифры,
исходя из текущей скорости роста, то можно ожидать, что к концу 1999 г.
Internet охватит около 180 млн. человек. В настоящее время темпы роста
составляют 100% ежегодно.
Сопоставьте
эти данные с 150-200 млн. персональных компьютеров, установленных во всем мире
и нам откроется потрясающая возможность развития сетевых коммуникаций. Домашние
компьютеры редко объединяются в сеть. Но многие пользователи хотели бы иметь
доступ к ресурсам Internet и дома, и на работе. Решение проблемы – модем и
соединение по телефонной линии.
До
недавнего времени доступ в Internet был затруднен, но рост числа поставщиков
услуг в сети заметно изменил ситуацию. Сейчас большинство провайдеров
предоставляет полный набор услуг Internet. Коммерческие сети, такие как
CompuServe и America Online, также предоставляют подключение к Internet. Еще в
апреле 1995 г. CompuServe реализовала доступ к своим узлам через PPP (Point
–to- Point Protocol- протокол узел-узел), с этого момента телефонный номер
CompuServe обеспечивал прямой доступ в Internet. До этого времени CompuServe предоставляла
основные услуги Internet, такие как FTP (File Transfer Protocol-протокол
передачи файлов) и телеконференции UseNet (дискуссии практически на любую
тему), которые были доступны абонентам через шлюзы.
America
Online также энергично вступила в бой. Уже имея опыт в области электронной
почты и UseNet, она быстро начала осваивать рынок услуг World Wide Web.
Новая
гипертекстовая среда, логически связавшая между собой данные, часто
расположенные на разных континентах, стала самой лучшей приманкой для новых
пользователей Internet. Рост числа абонентов World Wide Web происходит быстрее,
чем рост самой Internet. На сегодняшний день доступны около 30 тыс.
Web-серверов, а число новых Web-страниц ежемесячно увеличивается на 20%. В
дальнейшем темпы роста числа пользователей не собираются снижаться, это
справедливо как для коммерческих сетей, так и для провайдеров предоставляющих
доступ в режиме shell (доступ через оболочку UNIX).
Производят
впечатление и перемены в методах доступа. По мере возрастания интереса к
использованию в сеансах Internet графического интерфейса, позволяющего
оперировать выпадающим меню и мышью, провайдеры стали снижать цены на
соединение, позволяющие использовать данные программы. Цены на подключение по
SLIP (Serial Line Internet Protocol – межсетевой протокол последовательного
канала) и PPP стали снижаться, и основная масса пользователей поняли, что
возможность применения тех или иных инструментальных средств зависит от того,
каким способом они подключены к сети. Сегодня оба метода доступа существуют в
Internet « на равных », а программы с графическим интерфейсом становятся все
более популярны.
3.
Применения Интернета
Нам
не надо знать тонкости функционирования TCP/IP. Как увидим далее, работать с
пользовательскими программами Internet совсем не трудно.
Пользователи,
работающие с электронными досками объявлений (BBC) и коммерческими диалоговыми
службами, привыкли получать от своих поставщиков определенный набор услуг;
Internet предоставляет их по-своему через протоколы TCP/IP. Ниже рассмотрим,
как Internet реализует эти основные функции.
3.1 Электронная почта
Электронная
почта – наиболее простая и зачастую самая полезная. Многие пользователи
Internet имеют дело исключительно с электронной почтой, и все равно считают ее
бесценным ресурсом. Вы можете отправлять сообщения одному или нескольким людям,
пересылать текстовые файлы, получать информацию от автоматизированных
компьютерных программ и т.д. Несмотря на то, что никто не откажется иметь
полный доступ к Internet, бывают случаи, когда для удовлетворения самых насущных
информационных потребностей вполне хватает одной электронной почты.
Не
так давно шлюзы для электронной почты были единственной формой доступа к
Internet, предоставлявшейся крупными коммерческими диалоговыми системами. В те
дни многими овладела захватывающая идея: работать с Internet через электронную
почту.
Выполнение
этой задачи позволило бы получать реальные сетевые услуги, включая работу с
WAIS, Gopher и World Wide Web, не имея ничего, кроме почтового ящика.
Но
нельзя недооценивать электронную почту в своей простейшей форме; это средство
для обмена сообщениями или использования списков почтовой рассылки для людей,
интересующихся общей тематикой. Если использовать электронную почту ежедневно,
переписываясь с людьми, живущими на соседней улице или другом полушарии, то
через месяц или два вы будете удивлены, как же вы раньше так долго могли
обходиться без нее. По иронии судьбы в начале существования ARPANET электронная
почта считалась незначительным приложением к тем возможностям, которые
предоставляла сеть. Никто не ожидал возникновения огромного потока информации,
появившегося в тот период, когда ученые стали обмениваться своими идеями с
территориально отделенными коллегами. Сегодня наличие электронной почты
воспринимается как нечто само собой разумеющееся всеми – от небольших компаний
с офисными сетями до гигантских корпораций, имеющих свои отделения по всему
миру. Таким же стремительным был рост электронной почты в коммерческих сетях,
многие абоненты которых пользуются только этой услугой.
3.2 Передача файлов
Перемещение
файлов между компьютерами – одна из самых лучших возможностей, которые мы получили
благодаря сетевой революции. Если вы можете отыскать что-то полезное, и если
это, как тысячи компьютерных файлов в Internet, общедоступная информация, то
вы можете скопировать это на ваш компьютер. Средство, благодаря которому стал
возможен этот процесс, называется протоколом передачи файлов (file transfer
protocol), или FTP. Доступ к общедоступным материалам осуществляется через
процедуру под названием анонимный FTP. Эта процедура позволяет вам
регистрироваться на удаленных компьютерах и использовать источники информации в
каталогах, открытых для общего доступа администраторами систем.
Поиск
программ в Internet с помощью FTP – непростая задача. Вместо того чтобы
запросить каталог всех файлов объединенной библиотеки, как это происходит в
America Online, вы сталкиваетесь с тысячами компьютерных архивов, предлагающих
программы и текстовые файлы. Чтобы легко находить информацию нужно использовать
инструменты поиска. С их помощью мы сможем находить программы, затем с
использованием FTP загружать их в собственный компьютер.
3.3 Удаленный доступ
Удаленный
доступ иначе называемый Telnet, обеспечивает возможность подключаться к
удаленному компьютеру и работать с ним в интерактивном режиме. И здесь Internet
открывает двери во всемирную компьютерную среду со множеством компьютеров,
предлагающих программы, базы данных и другие ресурсы, которые мы можем
просматривать или использовать в работе.
Используя
Telnet, мы можем посещать библиотечные каталоги далеких университетов, искать
информацию о чем угодно – от образования далеких галактик до рецептов
картофельного супа, просматривать решения Верховного Суда или тексты популярных
песен. Все это время удаленный компьютер будет откликаться на команды, а
собственный компьютер работать как терминал. Во многих случаях системы на базе
меню, установленные на удаленных машинах, делают интерактивный сеанс работы
интуитивно понятным, но разные системы различаются между собой как внешним
оформлением, так и удобством в работе.
3.4 Как движутся данные – среда передачи
Легко
вообразить себе компьютерную сеть в таком виде, как мы могли бы увидеть ее в
деловом учреждении: компьютеры соединены кабелями, передавая информацию туда и
обратно, в то время как пользователи работают с клавиатурой. Однако соединения
в Internet нельзя рассматривать только как сеть проводов или
волоконно-оптических линий. Оцифрованные данные пересылаются через специальные
аппаратные устройства, называемые маршрутизаторами, которые соединяют сети и с помощью
сложных алгоритмов выбирают наилучшие маршруты для сетевого трафика.
Как
движутся пакеты данных? Иногда они передаются по телефонным линиям:
коммутируемым или выделенным, иногда по спутниковой связи. Информация может
также передаваться посредством микроволновой радиопередачи,
волоконно-оптических кабельных соединений и даже по так называемой пакетной
радиосвязи. Рассмотрим каждую возможность.
3.5 Коммутируемые линии
Телефонная
линия у вас дома – это коммутируемая линия; соединение производится, когда вы
набрали номер, и обрывается, когда вы вешаете трубку. Между двумя сетями перед
началом сеанса передачи данных также может быть установлено коммутируемое
соединение, а по окончании этой передачи – разъединено. Снижающаяся стоимость
междугородной и международной связи делает такой вариант возможным для тех, кто
работает с небольшими локальными сетями. Можно позвонить на узел Internet и,
используя только коммутируемые соединения, получить доступ к услугам Internet
даже в режиме интерактивного IP-узла.
3.6 Арендуемые линии
Арендуемые
линии работают по-другому. Они устанавливают постоянное соединение, которое
всегда позволяет передать поток информации между узлами; арендуемые линии часто
называют выделенными линиями. Выделенные линии, предназначенные для передачи
цифровых данных, различаются по скорости – от 2,5 Кбит/с до 45 Мбит/с. Линия Т1
обеспечивает скорость передачи 1,544 Мбит/с. Линия связи Т3 работает намного
быстрее, передавая данные со скоростью 45 Мбит/с, а технология ОСЗ поднимает
этот уровень до 155 Мбит/с.
3.7
Микроволновая связь
Микроволновое
оборудование позволяет соединять сети без проводов, переправляя данные с
помощью передатчика на приемную антенну места назначения. Между двумя пунктами
стоят репитеры (повторители), задача которых принять сигнал, усилить его и
передать на следующую станцию. Предельное расстояние между станциями может
меняться в зависимости от ландшафта, так как микроволновая связь действует в
среде прямой видимости.
4. Услуги предоставляемые сетью
Все
услуги предоставляемые сетью Internet можно условно поделить на две категории:
обмен информацией между абонентами сети и использование баз данных сети.
К
числу услуг связи между абонентами принадлежат.
Telnet
удаленный доступ. Дает возможность абоненту работать на любой ЭВМ сети
Internet как на своей собственной. То есть запускать программы, менять режим
работы и т.д.
FTP (File Transfer Protocol) протокол передачи файлов. Дает
возможность абоненту обмениваться двоичными и текстовыми файлами с любым
компьютером сети. Установив связь с удаленным компьютером, пользователь может
скопировать файл с удаленного компьютера на свой или скопировать файл со своего
компьютера на удаленный.
NFS
(Network File System) распределенная файловая система. Дает возможность
абоненту пользоваться файловой системой удаленного компьютера, как своей
собственной.
Электронная
почта обмен почтовыми сообщениями с любым абонентом сети Internet. Существует
возможность отправки как текстовых, так и двоичных файлов. На размер почтового
сообщения в сети Internet накладывается следующее ограничение размер
почтового сообщения не должен превышать 64 килобайт.
Новости
получение сетевых новостей и электронных досок объявлений сети и возможность
помещения информации на доски объявлений сети. Электронные доски объявлений
сети Internet формируются по тематике. Пользователь может по своему выбору
подписаться на любые группы новостей.
Rsh
(Remote Shell) удаленный доступ. Аналог Telnet, но работает только в том
случае, если на удаленном компьютере стоит ОС UNIX.
Rexec
(Remote Execution) выполнение одной команды на удаленной UNIX-машине.
Lpr
сетевая печать. Отправка файла на печать на удаленном (сетевом) принтере.
Lpq
сетевая печать. Показывает файлы стоящие в очереди на печать на сетевом
принтере.
Ping
проверка доступности удаленной ЭВМ по сети.
Talk
дает возможность открытия «разговора» с пользователем удаленной
ЭВМ. При этом на экране одновременно виден вводимый текст и ответ удаленного
пользователя.
Iptunnel
дает возможность доступа к серверу ЛВС NetWare с которым нет непосредственной
связи по ЛВС, а имеется лишь связь по сети Internet.
Whois
адресная книга сети Internet. По запросу абонент может получить информацию о
принадлежности удаленного компьютера, о пользователях.
Finger
получение информации о пользователях удаленного компьютера.
Кроме
вышеперечисленных услуг, сеть Internet предоставляет также следующие
специфические услуги.
Webster
сетевая версия толкового словаря английского языка.
Факс-сервис
дает возможность пользователю отправлять сообщения по факсимильной связи,
пользуясь факс-сервером сети.
Электронный
переводчик производит перевод присланного на него текста с одного языка на
другой. Обращение к электронным переводчикам происходит посредством электронной
почты.
Шлюзы
дают возможность абоненту отправлять сообщения в сети, не работающие с
протоколами TCPIP (Fido, Goldnet, AT50).
К
системам автоматизированного поиска информации в сети Internet принадлежат
следующие системы.
Gopher
наиболее широко распространенное средство поиска информации в сети Internet,
позволяющее находить информацию по ключевым словам и фразам. Работа с системой
Gopher напоминает просмотр оглавления, при этом пользователю предлагается
пройти сквозь ряд вложенных меню и выбрать нужную тему. В Internet в настоящее
время свыше 2000 Gopher-систем, часть из которых является
узкоспециализированной, а часть содержит более разностороннюю информацию.
Gopher
позволяет получить информацию без указания имен и адресов авторов, благодаря
чему пользователь не тратит много времени и нервов. Он просто сообщит системе
Gopher, что именно ему нужно, и система находит соответствующие данные.
Gopher-серверов свыше двух тысяч, поэтому с их помощью не всегда просто найти
требуемую информацию. В случае возникших затруднений можно воспользоваться
службой VERONICA. VERONICA осуществляет поиск более чем в 500 системах Gopher,
освобождая пользователя от необходимости просматривать их вручную.
WAIS
еще более мощное средство получения информации, чем Gopher, поскольку оно
осуществляет поиск ключевых слов во всех текстах документов. Запросы посылаются
в WAIS на упрощенном английском языке. Это значительно легче, чем формулировать
их на языке алгебры логики, и это делает WAIS более привлекательной для пользователей-непрофессионалов.
При
работе с WAIS пользователям не нужно тратить много времени, чтобы найти
необходимые им материалы.
В
сети Internet существует более 200 WAIS библиотек. Но поскольку информация
представляется преимущественно сотрудниками академических организаций на
добровольных началах, большая часть материалов относится к области исследований
и компьютерных наук.
WWW
система для работы с гипертекстом. Потенциально она является наиболее мощным
средством поиска. Гипертекст соединяет различные документы на основе заранее
заданного набора слов. Например, когда в тексте встречается новое слово или
понятие, система, работающая с гипертекстом, дает возможность перейти к другому
документу, в котором это слово или понятие рассматривается более подробно.
WWW
часто используется в качестве интерфейса к базам данных WAIS, но отсутствие
гипертекстовых связей ограничивает возможности WWW до простого просмотра, как у
Gopher.
Пользователь
со своей стороны может задействовать возможность WWW работать с гипертекстом
для связи между своими данными и данными WAIS и WWW таким образом , чтобы
собственные записи пользователя как бы интегрировались в информацию для общего
доступа. На самом деле этого, конечно, не происходит, но воспринимается именно
так.
WWW
это относительно новая система. Установлены несколько демонстрационных
серверов, в том числе Vatican Exibit в библиотеке Конгресса США и мультфильм о
погоде «Витки спутника» в Мичиганском государственном университете. В
качестве демонстрационных также работают серверы into.funet.fi (Финляндия);
into.cern.ch. (Швейцария) и eies2.njit.edu (США).
Практически
все услуги сети построены на принципе клиент-сервер. Сервером в сети Internet называется
компьютер способный предоставлять клиентам (по мере прихода от них запросов)
некоторые сетевые услуги. Взаимодействие клиент-сервер строится обычно
следующим образом. По приходу запросов от клиентов сервер запускает различные
программы предоставления сетевых услуг. По мере выполнения запущенных программ
сервер отвечает на запросы клиентов.
Все
программное обеспечение сети также можно поделить на клиентское и серверное.
При этом программное обеспечение сервера занимается предоставлением сетевых
услуг, а клиентское программное обеспечение обеспечивает передачу запросов
серверу и получение ответов от него.
5. Глобальные гипертекстовые структуры: WWW
World
Wide Web «Всемирная паутина«». (Короче: Web или W3)
Гипертекст
текст со вставленными в него словами (командами) разметки, ссылающимися на
другие места этого текста, другие документы, картинки и т.д. Во время чтения
такого текста (в соответствующей программе, его обрабатывающей и выполняющей
соответствующие ссылки или действия) вы видите подсвеченные (выделенные) в
тексте слова. Если наехать на них курсором и нажать клавишу или на кнопку
(глаз) мышки, то высветится то, на что ссылалось это слово, например, другой
параграф той же главы этого же текста. В WWW по ключевым словам можно попасть в
совершенно другой текст из другого документа, войти в какую-нибудь программу,
произвести какое-либо действие и т.д. В Internet в контексте WWW можно получать
доступ к чему угодно, к telnet, e-mail, ftp, Gopher, WAIS, Archie, USENET News
и т.п. В WWW можно ссылаться на данные на других машинах в любом месте сети,
тогда при активации этой ссылки эти данные автоматически передадутся на
исходную машину и вы увидите на экране текст, данные, картинку, а если провести
в жизнь идею мультимедиа, то и звук услышите, музыку, речь. Это слегка
напоминает Gopher, но фактически это принципиально другое и новое. В Gopher
имеется жесткая структура меню, по который вы двигаетесь, как вам угодно. Эта
структура не зависит от того, что вы делаете, какой документ пользуете и т.д. В
WWW вы двигаетесь по документу, который может иметь какую угодно гипертекстовую
структуру. Вы сами можете организовать структуры меню в гипертексте. Имея
редактор гипертекстов, вы можете создать любую структуру рабочей среды, включая
документацию, файлы, данные, картины, программное обеспечение и т.д., и это не
будет новое программное обеспечение, а просто гипертекст. Увы, создание
гипертекстовых редакторов с человеческим лицом (дружественным интерфейсом,
отладчиком и т.д.) задача не из простых и еще не решенная.
Так
как «читать» гипертекст приятнее (и вообще имеет смысл) в том случае, когда не
возникает задержек при активации ссылок (подкачка текста с другого сервера или
просто с сервера, но по местной сетевой линии, пересылка изображений, баз
данных и т.д.), то WWW следует устанавливать на быстрые линии. На медленных
линиях использование WWW превратится в сплошное мучение, ожидание, зависание,
все прелести и сам смысл теряются. Также нерационально работать, например, по
telnet в WWW на очень далеко расположенной машине, это влетит вам в добрую
копеечку. Именно поэтому хочется иметь такой сервер у себя в стране, хотя бы
один.
6. Доступ в Интернет
Доступ
в Internet, обычно, получают через поставщиков услуг (service provider).
Поставщики эти продают различные виды услуг, каждый из них имеет свои
преимущества и недостатки. Так же как и при покупке садовой тачки (в оригинале
автомобиля) вы решаете, какими качествами должна она обладать, сколько вы за
нее можете себе позволить заплатить, и, исходя из этого, выбираете подходящий
вариант из предлагаемого множества.
Но
перед тем, как начать действовать в этом направлении, т.е. добывать список
поставщиков Internet, читать и выбирать, связываться с ними, выясните, а не
имеете ли вы уже доступа в Internet, сами того не ведая. Такое вполне может
иметь место в России не так часто, в США не так уж и редко. Если ваша
организация или учреждение (институт, компания) уже имеет доступ в Internet, то
вряд ли вы сможете получить персональный доступ в сеть лучший, нежели ваша
организация.
Другими
словами, если вы уже имеете доступ в Internet, вам не надо будет платить денег
из своего кармана, не надо будет суетиться вокруг поставщиков услуг и т.д., вам
просто надо будет научиться пользоваться тем, что вы уже имеете.
Если
ваша организация пока не имеет доступа в Internet, или вообще-то имеет, но, вот
беда, не ваше подразделение (лаборатория, отдел, факультет), вам просто следует
понаблюдать и прикинуть, сколько еще потенциальных пользователей имеется среди
ваших сослуживцев, возможно, поговорить с ними и заручиться поддержкой,
составить предложение и/или подать требование вышестоящему руководству.
Имеются
(хотя это встречается, увы, пока очень редко) еще возможности получить доступ в
Internet не через ее прямых распространителей, без лишних затрат.
Первый
поищите в публичных библиотеках: некоторые (центральные) имеют службу,
называемую Freenet свободная (бесплатная) сеть. Это информационная система,
основанная соответствующим сообществом, обычно имеющая модемный доступ к
Internet по телефону.
Второй
путь полезен для молодых людей, проживающих в странах Запада, или в центральных
городах у нас. Станьте студентом, поступите в западный или организованный у нас
же в России совместно с Западом университет или колледж. И выберите
соответствующую специальность или запишитесь на курсы, которые позволят вам добраться
до заветного компьютера, имеющего доступ в Internet. Например, научитесь плести
лапти уже потом вам будет чем развлечься, когда у вас от непрерывной работы в
сети поедет крыша. И когда вы научитесь, у вас будет еще один довод начальству
в пользу предоставления вам доступа в Internet: сети как воздух необходима база
данных с инструкциями по плетению лаптей, без них они как без рук. Такой вклад
руководство не сможет не оценить по достоинству.
7. Поиск информации в Интернете
Основная
задача Internet – предоставление необходимой информации. Чтобы найти нужную
информацию необходимо знать адрес Web-страницы, на которой эта информация
находится.
Лучше
всего искать в Сети необходимую информацию с помощью поисковых систем.
Поисковая система представляет собой специализированный Web-узел. Поисковые
системы классифицируют по методам поиска.
Поисковые
каталоги предназначены для поиска по темам. Обычно они построены по
иерархическому принципу, т.е. каждый шаг поиска это выбор подраздела с более
конкретной тематикой искомой информации. На нижнем уровне поиска пользователь
получает относительно небольшой список ссылок на искомую информацию.
Поисковый
индекс обеспечивает поиск по заданным ключевым словам. Обычно ключевые слова
вводятся при заполнении специальной формы поиска, после чего нажимается кнопка
Поиск. В результате поиска формируется набор гиперссылок на Web-страницы,
содержащий указанные термины. Обычно поисковые индексы выдают огромное
количество искомых страниц.
В
этом списке представлены ссылки на различные Web-страницы, причем ссылки
располагаются по степени убывания встреченных на данных страницах слов,
совпадающих с ключевыми словами. При просмотре списка необходимо выбрать те
страницы, которые нужно просмотреть. Некоторые системы составляют список ссылок
по степени свежести страниц, другие же по степени вероятности того, что
данные страницы окажутся искомыми. Вычисление вероятности основывается на
данных о том, как скоро на странице встречается искомое слово. Первыми в таком
списке идут ссылки на те страницы, у которых ключевые слова встречаются уже в
названии.
Поисковые
каталоги предоставляют доступ к меньшему количеству страниц, чем поисковые
индексы, но они точнее указывают на основные ресурсы Сети. Поэтому при
первичном поиске информации целесообразно использовать поисковые каталоги. А
квалифицированным пользователям Internet более полезны поисковые индексы. Они
позволяют разыскать малоизвестные и узкоспециализированные ресурсы.
Многие
современные поисковые системы сочетают в себе оба указанных метода.
Программа
Internet Explorer 5.0 имеет специальные средства организации поиска без явного
обращения к поисковым системам. Можно получить доступ к одной из известных
поисковых систем, просто щелкнув на кнопке Поиск браузер Internet Explorer.
Если
в Internet Explorer щелкнуть по кнопке Поиск, слева появится окно поиска. Далее
можно набрать ключевые слова для поиска и выбрать поисковую систему. Результаты
поиска будут отражены в правой части окна обозревателя. Если выбрать нужную
ссылку, то в правом окне появится содержимое выбранной страницы. Чтобы скрыть
окно поиска, необходимо щелкнуть на кнопке Поиск еще раз.
При
работе с Internet Ехр1orer можно проводить поиск прямо в поле Адрес. Для этого
в адресную строку вводиться слово или фраза для поиска. Под адресной строкой
откроется окно со словом Поиск: и искомой фразой.
Internet
Explorer начнет поиск с использованием заранее определенной системы поиска; при
этом кнопка Поиск на панели инструментов нажмется сама.
Можно
осуществить поиск нажав кнопку Пуск и выбрав опцию меню Найти, а затем в
Интернете. Окно Internet Explorer откроется само с уже нажатой кнопкой Поиск.
Если
удалось найти то, что искали, но все же не совсем то, то в этом случае
пригодится механизм связанных ссылок. Для любой Web-страницы можно просмотреть
список ссылок, имеющих к ней отношение, возможно, среди них окажется как раз
то, что нужно. Чтобы просмотреть связанные ссылки, нужно сделать следующее.
Необходимо выбрать в меню Сервис команду Показать связанные ссылки.
После
этого на панели инструментов нажать кнопку Поиск, и в левой части экрана
полнится окно, содержащее список ссылок, связанных с данной страницей. Нужно
щелкнуть на одной из ссылок, и просмотреть в правом окне соответствующую
Web-страницу. Чтобы скрыть окно поиска, необходимо щелкнуть еще раз на кнопке
Поиск.
8.Словарь терминов
8.1
Русские термины
Драйвер
загружаемая в оперативную память программа, управляющая обменом данными между
прикладными процессами и внешними устройствами.
Гипертекст
документ, имеющий связи с другими документами через систему выделенных слов
(ссылок). Гипертекст соединяет различные документы на основе заранее заданного
набора слов. Например, когда в тексте встречается новое слово или понятие,
система, работающая с гипертекстом, дает возможность перейти к другому
документу, в котором это слово или понятие рассматривается более подробно.
ЛВС
локальная вычислительная сеть.
Маршрутизатор
(router) компьютер сети, занимающийся маршрутизацией пакетов в сети, то есть
выбором кратчайшего маршрута следования пакетов по сети.
Модем
устройство преобразующее цифровые сигналы в аналоговую форму и обратно.
Используется для передачи информации между компьютерами по аналоговым линиям
связи.
НЖМД
накопители на жестком магнитном диске.
Протокол
совокупность правил и соглашений, регламентирующих формат и процедуру между
двумя или несколькими независимыми устройствами или процессами. Стандартные
протоколы позволяют связыватся между собой компьютерам разных типов, работающим
в разных операционных системах.
Ресурс
логическая или физическая часть системы, которая может быть выделена
пользователю или процессу.
Сервер
компьютер в сети, предоставляющий свои услуги другим, то есть выполняющий
определенные функции по запросам других.
Узел
компьютер в сети, выполняющий основные сетевые функции (обслуживание сети,
передача сообщений и т.п.).
Хост
сетевая рабочая машина; главная ЭВМ. Сетевой компьютер, который помимо
сетевых функций (обслуживание сети, передача сообщений) выполняет
пользовательские задания (программы, расчеты, вычисления).
Шлюз
станция связи с внешней или другой сетью. Может обеспечивать связь
несовместимых сетей, а также взаимодействие несовместимых приложений в рамках
одной сети.
Электронная
почта обмен почтовыми сообщениями с любым абонентом сети Internet.
8.2
Английские термины
Archie
архив. Система для определения местонахождения файлов в публичных архивах
сети Internet.
ARP
(Address Resolution Protocol) протокол определения адреса, преобразует адрес
компьютера в сети Internet в его физический адрес.
ARPA
(Advanced Research Projects Agency) бюро проектов передовых исследований
министерства обороны США.
ARPANET
эксперементальная сеть, работавшая в семидесятые годы, на которой проверялись
теоретическая база и програмное обеспечение, положеные в основу Internet. В
настоящее время не существует.
Bps
(bit per second) бит в секунду. Единица измерения пропускной способности
линии связи. Пропускная способность линии связи определяется количеством
информации, передаваемой по линии за единицу времени.
Cisco
маршрутизатор, разработанный фирмой Cisco-Systems.
DNS
(Domain Name System) доменная система имен. распределенная система баз данных
для перевода имен компьютеров в сети Internet в их IP-адреса.
Ethernet
тип локальной сети. Хороша разнообразием типов проводов для соединений,
обеспечивающих пропускные способности от 2 до 10 миллионов bps(2-10 Mbps).
Довольно часто компьютеры, использующие протоколы TCP/IP, через Ethernet
подсоединяются к Internet.
FTP (File Transfer Protocol) протокол передачи файлов.
-протокол,
определяющий правила пересылки файлов с одного компьютера на другой.
-прикладная
программа, обеспечивающая пересылку файлов согласно этому протоколу.
FAQ
(Frequently Asked Qustions) часто задаваемые вопросы. Раздел публичных
архивов сети Internet в котором хранится информация для «начинающих»
пользователей сетевой инфраструктуры.
Gopher
интерактивная оболочка для поиска, присоединения и использования ресурсов и
возможностей Internet. Интерфейс с пользователем осуществлен через систему
меню.
HTML
(Hypertext Markup Language)- язык для написания гипертекстовых документов.
Основная особенность наличие гипертекстовых связей между документами
находящимися в различных архивах сети; благодаря этим связям можно
непосредственно во время просмотра одного документа переходить к другим
документам.
Internet
глобальная компьютерная сеть.
internet
технология сетевого взаимодействия между компьютерами разных типов.
IP
(Internet Protocol) протокол межсетевого взаимодействия, самый важный из протоколов
сети Internet, обеспечивает маршрутизацию пакетов в сети.
IР-адрес
уникальный 32-битный адрес каждого компьютера в сети Internet.
Iptunnel
одна из прикладных программ сети Internet. Дает возможность доступа к серверу
ЛВС NetWare с которым нет непосредственной связи по ЛВС, а имеется лишь связь
по сети Internet.
Lpr
сетевая печать. Команда отправки файла на печать на удаленном принтере.
Lpq
сетевая печать. Показывает файлы стоящие в очереди на печать.
NetBlazer
маршрутизатор, разработанный фирмой Telebit.
NetWare
сетевая операционная система, разработанная фирмой Novell; позволяет строить
ЛВС основанную на принципе взаимодействия клиент-сервер. Взаимодействие между
сервером и клиентом в ЛВС NetWare производится на основе собственных протоколов
(IPX), тем не менее протоколы TCP/IP также поддерживаются.
NFS
(Network File System) распределенная файловая система. Предоставляет
возможность использования файловой системы удаленного компьютера в качестве
дополнительного НЖМД.
NNTP
(Net News Transfer Protocol) протокол передачи сетевых новостей. Обеспечивает
получение сетевых новостей и электронных досок объявлений сети и возможность
помещения информации на доски объявлений сети.
Ping
утилита проверка связи с удаленной ЭВМ.
POP (Post Office Protocol) протокол «почтовый оффис». Используется для обмена почтой между хостом и абонентами.
Особенность протокола обмен почтовыми сообщениями по запросу от абонента.
PPP
(Point to Point Protocol) протокол канального уровня позволяющий использовать
для выхода в Internet обычные модемные линии.
Относительно
новый протокол, является аналогом SLIP.
RAM (Random Acsess Memory) оперативная память.
RFC (Requests For Comments) запросы комментариев. Раздел публичных архивов сети Internet
в котором хранится информация о всех стандартных протоколах сети Internet.
Rexec
(Remote Execution) выполнение одной команды на удаленной UNIX-машине.
Rsh
(Remote Shell) удаленный доступ. Аналог Telnet, но работает только в том
случае, если на удаленном компьютере стоит ОС UNIX.
SLIP
(Serial Line Internet Protocol) протокол канального уровня позволяющий
использовать для выхода в Internet обычные модемные линии.
SMTP
(Simple Mail Transfer Protocol) простой протокол передачи почты. Основнная
особенность протокола SMTP обмен почтовыми сообщениями происходит не по
запросу одного из хостов, а через определенное время (каждые 20 30 минут).
Почта между хостами в Internet передается на основе протокола SMTP.
Talk
одна из прикладных программ сети Internet. Дает возможность открытия
«разговора» с пользователем удаленной ЭВМ. При этом на экране
одновременно печатается вводимый текст и ответ удаленного пользователя.
Telnet
удаленный доступ. Дает возможность абоненту работать на любой ЭВМ сети
Internet как на своей собственной.
TCPIP
под TCPIP обычно понимается все множество протоколов поддерживаемых в сети
Internet.
TCP
(Transmission Control Protocol) протокол котроля передачи информации в сети.
TCP протокол транспортного уровня, один из основных протоколов сети Internet.
Отвечает за установление и поддержание виртуального канала (т.е. логического
соединения), а также за безошибочную передачу информации по каналу.
UDP
(User Datagram Protocol) протокол транспортного уровня, в отличие от
протокола TCP не обеспечивает безошибочной передачи пакета.
Unix
многозадачная операционная система, основная операционная среда в сети
Internet. Имеет различные реализации: Unix-BSD, Unix-Ware, Unix-Interactive.
UUCP
протокол копирования информации с одного Unix-хоста на другой. UUCP не
входит в состав протоколов TCP/IP, но тем не менее все-еще широко используется
в сети Internet. На основе протокола UUCP построены многие системы обмена
почтой, до сих пор используемые в сети.
VERONICA
(Very Easy Rodent-Oriented Netwide Index to Computer Archives) система поиска
информации в публичных архивах сети Internet по ключевым словам.
WAIS
(Wide Area Information Servers) мощная система поиска информации в базах
данных сети Internet по ключевым словам.
WWW
(World Wide Web) всемирная паутина.
Система
распределенных баз данных, обладающих гипертекстовыми связями между
документами.
Whois
адресная книга сети Internet.
Webster
сетевая версия толкового словаря английского языка.
Заключение.
В
этой главе я попытался осветить некоторые сферы использования глобальной сети
Интернет в нашей жизни. В настоящее время через Интернет можно делать
практически всё – делать покупки, заказывать авиабилеты и номера в отелях,
рекламировать свои товары и фирмы, общаться самыми различными способами, найти
там можно абсолютно всё, а если чего-то там нет, значит, этого нет вообще,
можно дружить и даже влюбляться, и это далеко не всё. Возможности Интернет
практически безграничны, единственное, чего глобальная сеть никогда не сможет
заменить – это прелести живого общения, прелести писем, написанных рукой друга
или любимого человека, сидя перед мерцающим экранов никогда нельзя будет
сходить погулять с друзьями в «реале». Это, конечно, большой недостаток сети,
но вместе с тем и большое достоинство, потому что нельзя навечно переселяться в
виртуальную реальность, всё-таки мы живые люди, а не машины.
Раздел 2
Анализ поисковых систем Интернет
Поисковые системы
Помочь
пользователю найти нужную информацию в Сети призваны поисковые системы. В
поиске нужных ресурсов пользователь вводит одно или несколько ключевых слов,
которые, по его мнению, лучше всего отражают суть интересующего вопроса.
Поисковая система за считанные секунды просматривает весь собственный каталог
веб-ресурсов (индекс), состоящий из десятков и сотен гигабайт информации. В
результате предлагается список ссылок на страницы, в которых встречаются
указанные слова.
Любой
поисковый сервер представляет собой огромное хранилище информации. Собирают эту
информацию специальные роботы так называемые Spiders (пауки) или Bots. Они
ползают по узлам всемирной паутины и собирают данные о сайтах – индексируют их.
Периодически робот возвращается на свой сервер и отдает ему собранную
информацию. Там эта информация приводится в надлежащий вид, заносится в специальную
базу данных и после этого может быть найдена пользователем поисковых сайтов. По
некоторым данным, поисковые сервера могут дать Вам от 30 до 60% суммарного
трафика веб-сайта. Найденные поисковой машиной документы относятся к одной из
двух категорий: одни соответствуют запросу (релевантны), другие ему не
соответствуют, то есть нерелевантны…
На
этом простом механизме в настоящее время строится перспективный бизнес. Сами
поисковые машины тоже относятся к одной из двух категорий: одни технологически
эффективны, другие наоборот. Однако, современные поисковики настолько сложные
системы, что уже не могут быть описаны в кооординатах «хорошо-плохо»
Вот
наиболее известные поисковые системы:
Русские
поисковые системы:
Rambler
Апорт!
Yandex
Ау!
Lycos
Punto
Лупа.ru
Созвездие
Интернет
Россия
в Сети
Weblist
Улитка
Релком
Diamond
Tree
Иван
Сусанин
Иван
Сусанин (втоpой)
List
Украинские
поисковые системы:
Пошук
Uahoo
Холмс
(по Украине)
UAportal
Ping
Мета
(по Украине)
NSearch
(по Украине)
Иностранные
поисковые системы:
AltaVista
Excite
HotBot
InfoSeek
InfoSeek Ultra
LinkStar
LinkMaster
Lycos
Magellan
OpenText
Switchboard
Webcrawler
Yahoo
All 4 One
European Directory
EZ-Find
Internet Directory
New Riders’ Official World Wide Web
Yellow Pages
Cyberlands Web Search
All In One Search Page
Internet Sleuth
EINet’s Finding Things on the Net
ISP Internet Yellow Pages
W3 Search Engines
Home Page Directory
The WWW Worm
WebSearch
Русскоязычные поисковые механизмы в Интернет
Многие
популярные Web-узлы так и остались бы неизвестными, если бы не
справочно-поисковые системы
Это
должно было произойти, и это произошло. 1996 год стал годом появления и
быстрого распространения поисковых систем, специализирующихся на выявлении, в
первую очередь, русскоязычных материалов. Закономерность этого процесса
понятна, поскольку к тому моменту российский блок Интернет уже накопил обширный
по объему и ценный по содержанию информационный массив, и стал полноправной
составной частью всемирных киберресурсов. Образование поисковых систем явилось
как бы еще одним доказательством реальной значимости накопленного
информационного массива: как только сформировалось то, что нужно искать,
появились инструменты, позволяющие это делать.
Русскоязычные
поисковые средства возникли не на пустом месте. У их разработчиков было время
собраться с мыслями и проанализировать многочисленные зарубежные аналоги
(забегая вперед, отметим, что этой возможностью воспользовались далеко не все).
Тем более, что принципиально новые решения изобрести было довольно сложно.
Российские поисковые системы сохранили традиционное деление на электронные
справочники, позволяющие последовательно знакомиться с материалами по
определенным отраслям и темам, и поисковые системы в чистом виде, с помощью
которых осуществляется поиск источников по узкому профилю.
Среди
справочников на роль российского Yahoo! претендовали два программных продукта:
«Паук» (http://spider.raser.ru) и «Созвездие Internet»
(http://www.stars.ru).
«Паук»,
плетущий свои сети с 1995 года (единственный, обогнавший время) и уже ставший
ветераном отечественного сетевого поиска, имеет интерфейс без особых изысков,
но зато несколько иерархических уровней. Логичность отраслевой иерархии
оставляет желать много лучшего, поэтому для его использования требуется порой
нестандартное мышление, иначе трудно определить, в каком разделе могут
находиться требуемые данные. Такая запутанность справочника уже сейчас
затрудняет работу, а с ростом объемов информации эта проблема будет все более и
более усугубляться. Выборочная проверка оперативности обновления разделов
«Паука» показала, что система поддерживается в актуальном состоянии
довольно слабо. В ней отсутствуют некоторые очень информативные серверы,
появившиеся более полугода назад.
В
своей нынешней версии «Паук» поддерживает все русские кодировки, а
также дает возможность непосредственного поиска, который, как это часто бывает
у справочников, ограничен названиями, первым строками текста (комментариями) и
электронными адресами Web-страниц. Поисковый блок не позволяет употреблять в
запросе даже простые операторы «и» и «или», поэтому розыск
может вестись одновременно только по одному понятию, с возможностью усечения
окончаний слов с помощью «*».
«Созвездие
Internet«, нашедшее пристанище на известном сервере »ИнфоАрт»,
относится к новейшим разработкам, что заметно по его интерфейсу, выполненному
на высоком уровне с применением фреймов и качественной графики: функционально и
одновременно внешне привлекательно. К сожалению, содержание
«Созвездия» пока отстает от его внешнего вида. Справочник не имеет разветвленной
иерархической структуры. Основной ряд включает разделы «Компьютеры и
технологии«, »Экономика и бизнес«, »Медицина и
здоровье«, »СМИ«, »Искусство и культура»,
«Образование и наука», «Техника и транспорт», «Отдых и
развлечения« и »Разное». При раскрытии раздела идет
непосредственное перечисление серверов данной тематики, число которых пока
также невелико. В среднем оно составляет около 40, а памятуя о том, что в
России число серверов давно превысило 3000, легко понять, что фрагмент,
отраженный в «Созвездии», очень невелик. Один из немногих
положительных моментов то, что помимо названия сервера в справочник
включается также краткая характеристика его содержания. Прямой же поиск в
«Созвездии Internet» не выходит за пределы названий и аннотаций уже
учтенных серверов.
Для
ориентации в отечественном киберпространстве также может помочь электронная
версия «Желтых страниц Интернет (русские ресурсы)» издательства
«Питер», хранящаяся по адресу
(http://proxy.menatep.elcom.ru/yp/yp_about.htm).
Русскоязычные
поисковые средства в чистом виде (search engines) предоставляют более широкие
возможности выбора. К ним относятся Rambler (http://www.rambler.ru),
«Новый русский поиск» (http://www.openweb.ru/koi8), Апорт! http://www.aport.ru/»Русская
машина поиска» (http://search.interrussia.com) и Russian Internet Search (http://www.search.ru).
«Русская
машина поиска», несмотря на название, является зарубежной разработкой,
ориентированной, тем не менее, исключительно на русскоязычные ресурсы по всему
Интернету. Как показывают тесты, она бороздит русскоязычное киберпространство
весьма выборочно. Вероятно, ориентиром выступает значимость того или иного
узла, определяемая создателями «Машины». Меню запроса
«Машины» предлагает пользователю возможность самому устанавливать или
отменять чувствительность к написанию заглавных и строчных букв, а также
указывать количество возможных ошибок в искомом слове, если нет уверенности в
его написании. Последнее качество, кстати, весьма полезно и при
многовариантности запроса типа «библиотека или библиотеки или
библиотек«, поскольку усекать термины »Машина» принципиально не
позволяет.
«Русская
машина поиска» обладает довольно непривычной формой выдачи результатов,
определяемой используемым инструментом Harvest. Перед пользователем предстают
нагромождения из английских и русских слов и символов. После некоторого
разбирательства удается понять, что все не так сложно, просто один длинный URL
разбит зачем-то на несколько составных частей, привычный title назван
«Description», а каждое вхождение искомого термина обозначено
отдельной строкой. Единственной положительной стороной такой детализации
является возможность сразу увидеть, в какой части Web-страницы содержится
искомый термин, а иногда даже и в каком контексте он употреблен. Впрочем, такую
пестроту результатов можно и отменить через меню, однако в этом случае
информация в ссылке сократится до электронного адреса найденного объекта. К
сожалению, система не ранжирует результаты поиска, поэтому зачастую приходится
просматривать список до самого конца, ища наиболее ценные ссылки.
Поисковая
система Rambler
адрес:
http://www.rambler.ru
Краткий обзор
Поисковая система Рамблер начала свое
существование с 1996 года. На сегодняшний день она является одной из самых
популярных в РуНете, уступая лишь Яндексу (по популярности). По оценкам SpyLog
на Рамблер приходится 20-25% от всех поисковых запросов РуНета.
Поисковая система Рамблер при поиске учитывает
морфологию русского языка, что дает больше возможностей для эффективного поиска
информации. Реализована также система так называемых «перевязок»,
которая позволяет выдавать в результатах поиска не только страницы содержащие
запрос, но и слова, которые являются синонимами запроса. Еще одной функцией
«перевязок», думаю более значимой, является выдача контекстной
рекламы не только по конкретному запросу, но и по запросам, которые тесно
связаны с исходным, это позволяет перекрыть большее количество целевой
аудитроии.
На Rambler функционирует также рейтинговая
система Rambler’s Top 100(http://www.top100.rambler.ru/, здесь можно прочитать
его описание), в которой можно найти наиболее посещаемые сайты по определенной
тематике. На данный момент это самый популярный рейтинг РуНета, даже можно
сказать, что это один из немногих рейтингов РуНета, в которых стоит участвовать.
Рамблер находит именно то, что Вам нужно,
результаты поиска максимально соответствуют запросу. Вам не придется искать
нужные документы среди множества ссылок.
По соответствию запросу оцениваются не только
отдельные документы, но и целые сайты. Благодаря объединению по сайтам за одним
ответом на Ваш запрос могут стоять десятки найденных документов.
Робот Рамблера, индексирующий российский
Интернет, обходит его значительно чаще. Новые страницы быстрее попадают в
результаты поиска, «мертвые» – уходят.
Поисковая машина понимает, что «идет»
и «шёл» формы одного и того же слова. То же и с английскими словами
например, «go» и «went». И даже совсем новые, незнакомые
ей слова машина умеет склонять и спрягать: поищите, например, «виндозные
сидюки».
На популярные новостные сайты (Рамблер-Медиа,
Лента.ру, Газета.ру, НТВ и другие) робот Рамблера заходит по несколько раз в
сутки. Переключившись на поиск «по новостям», Вы найдете информацию о
последних событиях почти сразу после ее появления на сайтах агентств и
онлайновых СМИ.
Рамблер по-прежнему остается самой быстрой
поисковой системой На конкурсе «Золотая паутина»
информационно-поисковая система Рамблер была отмечена первым призом в номинации
«Лучший коммерческий проект года».
Действительно, компания Рамблер по праву
считается первой крупной рекламной площадкой российского Интернета и стоит у
истоков классического сетевого рекламного бизнеса.
Нынешняя позиция Рамблера в
российском Интернет и на рынке интернет-рекламы
В
настоящий момент Интернет-холдинг Rambler несмотря на обострившуюся конкуренцию
по-прежнему уверенно сохраняет лидирующие позиции крупнейшей рекламной
площадки. Рамблер это комплексный информационный сервис, охватывающий
практически весь российский интернет. Рамблер самый популярный в российском
интернете портал, объединивший поисковую систему, рейтинг-классификатор, а
также ряд бесплатных сервисов и информационных проектов. В состав
интернет-холдинга входят портал Рамблер, новостная интернет-газета Лента.ру,
медицинский сайт Doctor.ru, онлайновый клуб родителей Mama.ru, картографический
сервис NaKarte.ru, телекоммуникационное подразделение «Рамблер
Телеком». Рамблер активно развивается, расширяя количество сервисов и
информационных ресурсов. В настоящее время в недрах компании формируется
уникальный интерактивный телевизионный канал Rambler ТелеСеть, который с 1
января 2003 года начинает вещание в России, странах Балтии и СНГ.
Также
осуществляется работа по разработке и внедрению передовых рекламных технологий,
призванных повысить эффективность онлайновых кампаний, отвечающих растущим
требованиям рынка и запросам рекламодателей.
Информация
об аудитории Рамблера
На
протяжении многих лет ресурсы Рамблера наиболее посещаемые в России, о чем
свидетельствуют данные исследовательских компаний Gallup Media и КОМКОН 2.
Ежемесячно посетителями Рамблера становятся около 10 миллионов пользователей со
всего мира, из них 3 миллиона пользователей составляет российская аудитория.
Аудитория Рамблера составляет более 700 тыс. посетителей в день, в том числе
500 000 россиян.
«Апорт»
http://www.aport.ru/
Поисковая
машина «Апорт» была впервые продемонстрирована в феврале 1996 года на
пресс-конференции «Агамы» по поводу открытия «Русского
клуба». Тогда она искала только по сайту russia.agama.com. Потом она
начала искать по четырем, потом по шести серверам… Короче, день рождения и
фактический старт системы сильно «размазались» по времени, а
официальная презентация «Апорта» состоялась только 11 ноября 1997
года. К тому времени в его базе был проиндексирован первый миллион документов,
расположенных на 10 тысячах серверов. Создателем системы выступила компания
«Агама» разработчик программного обеспечения для платформы Windows,
главным из которых являлся корректор орфографии «Пропись».
Лингвистические разработки «Агамы» использовались при создании
поисковой машины, в которой, скажем, в отличие от «Рамблера», изначально
учитывалась морфология слов и осуществлялась по желанию клиента проверка
орфографии запроса.
По
тем же историческим причинам «Апорт» создавался и продолжает
функционировать под Windows NT, хотя в XXI веке уже становится очевидным, что
поисковая машина должна работать на платформе UNIX (когда речь идет о системе
на базе NT, включающей 40-50 серверов, то кнопку Reset приходится нажимать
несколько раз в день, а вовсе не один раз в месяц). Правда, «Апорт»
не использует единственное кластерное решение, которое предлагает Microsoft (MS
Claster Server со всеми его ограничениями), и вообще избегает универсальных
решений (не используется, например, SQL-сервер или Oracle они хороши для
большого круга задач, но не для полнотекстового поиска).
Важнейшими
свойствами первой версии «Апорта» являлся перевод запроса и
результатов поиска на английский язык и обратно, а также реконструкция всех
проидексированных страниц из собственной базы (что означает возможность
просмотра страниц, уже несуществующих в оригинале).
В
ноябре 1998 года компания «Агама» была куплена за 55 тысяч долларов
израильским капиталом в лице Джозефа Авчука (с сохранением торговых марок
«Апорт» и «Агама»). В марте 1999 года Авчук входит в долю,
а летом того же года окончательно покупает каталог Ау!, торговой марке которого
повезло существенно меньше она была переименована сначала в AtRus, а потом и
вовсе уничтожена при экспорте каталога на сайты «России он-лайн»,
«Омен» и «Апорт». К концу 1999 года Авчук вложил в
«Апорт» и AtRus первый миллион долларов, позволивший в октябре того
же года представить на компьютерных выставках по обе стороны океана
принципиально новую поисковую машину «Апорт 2000», полностью
интегрированную с Atrus (ныне «Каталог-Апорт»).
«Апорт
2000» стал первым русским поисковиком, построенным на основе выдачи
результатов по отдельно взятым сайтам. Для разделения ресурсов на сайты
используется информация, которую «Апорту» предоставляет каталог AtRus
или сведения, введенные в «Апорт» владельцами ресурсов. На худой
конец, приходится опираться на алгоритм, который позволяет по некоторым
формальным признакам выделить отдельные сайты.
«Апорт
2000» стал первой российской поисковой машиной, практически реализовавший
две базовых технологии американской поисковой машины Google. Первая учет
«ранга страницы» (Page Rank), который характеризует ее популярность
(вычисляется по количеству ссылок на ресурс из внешнего Интернета: вес ссылки с
популярного сайта выше, чем вес ссылки с менее популярного; ссылки, включающие
слова запроса, имеют больший вес, чем, скажем, слово «здесь»). Вторая
обработка запроса, ориентируясь на HTML-код страницы (к примеру, анализ
текста, содержащегося между тегами шрифтов h2 и h6 дает больший приоритет для
первого варианта). В «Апорт 2000» учитывается также вхождение слов
запроса в URL. Среди недокументированных особенностей больший приоритет
сайтам, получившим высшую и элитную лигу в каталоге AtRus.
Еще
на этапе разработки «Апорта 2000» в него были заложены
«крючечки», позволяющие корректировать приоритеты в выдаче
результатов с учетом посещаемости сайтов по счетчику Aport Top 1000 и для
сайтов, чье название в службах реальных имен является синонимом или совпадает
со словами запроса (так как любая служба имен модеририруется, и полной чуши в
ее данных быть не может). Обе эти возможности до сих пор не реализованы.
Можно
отметить и то, что «Апорт» первым устроил поиск по новостным лентам
(какие бы ложные сведения о приоритете «Яндекса» в этом сервисе не
распускал в свое время Internet.ru).
И,
наконец, еще одно первенство «Апорта» использование платной нулевой
строки в выдаче (кстати, «Апорт» первым среди наших поисковиков начал
покупать такой сервис у AltaVista, которая за небольшую плату выдавала его
ссылку первой при запросе «Russian Search»). Однако в «Апорте»
нельзя купить не нулевое, а просто более высокое место для своего сайта в
результатах поиска.
Пользователи
«Апорта» (в отличие завсегдатаев «Яндекса») мало пользуются
расширенным поиском (на 8000 загрузок простой страницы приходится 300 вызовов
страницы «Расширенный поиск»).
Организация
масштабируемости в архитектуре «Апорт 2000» такова, что можно дробить
поисковую базу «Апорта» на несколько отдельных баз, каждый маленький
«Апорт» работает на своем компьютере. «Апорт 2000» считает,
что весь Интернет поделен на фрагменты. После проведения поиска по этим
фрагментам, пользователю интегрируется и выдается общий ответ. Добавлять новые
маленькие «апортики» можно путем не очень сложной процедуры. В
случаях аварий отдельных машин выдаются несколько отличные от штатных
интегральные результаты, что мы можем время от времени наблюдать.
31
июля 2000 года Golden Telecom купил семейство интернет-проектов
«Агама», включающее «Апорт» и AtRus, для включения в
«Россию-он-лайн» и околоконтентные проекты.
В
мае 2001 года окончательно завершилась сделка по смене хозяина самого Golden
Telecom. Андрей Косогов (первый заместитель председателя правления
«Альфа-банка») сообщил «Интерфаксу» о том, что новые
владельцы контрольного пакета будут осуществлять только стратегическое управление
Golden Telecom через совет директоров (все прежние хозяева «Апорта»
непосредственно вмешивались в управление проектом).
Поисковая
система Yandex.
www.yandex.ru
www.ya.ru
текстовая версия
На
сегодняшний день имеет самую большую базу данных, которая имеет кластерную
структуру и размещена на нескольких серверах.
В
1996 году компанией CompTek, созданной со стопроцентным американским участием,
на выставке Internetcom было официально объявлено о существовании
«Яндекса». Это была морфологическая приставка к
«Альтависте», которую отличало быстродействие и умение строить
гипотезы. Пословный индекс для незнакомых слов организован также, как и для
словарных этим «Яндекс» отличается от других поисковиков.
23
сентября 1997 года «Яндекс» стал интернет-проектом. Релевантность
документов вычислялась в зависимости от частотных характеристик искомых слов,
веса слова или выражения, близости искомых слов в тексте документа друг к другу
и так далее. В октябре 1999 года в интервью «ИнфоБизнесу» Аркадий Волож
указал: «Финансирование »Яндекса» всегда было не ниже
сегодняшнего финансирования «Апорта». В результате, 6 июня 2000 года
была представлена вторая версия системы, а нынешняя версия функционирует с 23
мая 2001 года. Ее главное нововведение, которое потребовало неизбежной
перестройки ядра, ранжирование по ссылкам. Другие нововведения относятся,
главным образом, к переформулированию системой запросов пользователя: «что
такое предмет« преобразуется в »предмет это…», а если запрос
начинается на слово «как», то в результатах в первую очередь пытаются
выдать FAQ или иной справочный документ. Новый «Яндекс» стал
«понимать» альтернативную лексику, которая входит в 5 процентов
запросов. Только в последней версии Яндекса индекс цитируемости стал непосредственно
использоваться поисковой машиной.
В
настоящее время «Яндекс» обладает самой полной базой документов среди
русских искалок, а также самой узнаваемой маркой.
Сравнение
качества поиска
Поисковая
машина характеризуется двумя важнейшими параметрами: точностью и полнотой
(полнота есть отношение количества найденных релевантных документов к полному
количеству релевантных документов в базе данных).
Пример.
Пусть по запросу найдено 50 документов. После просмотра их всех пользователь
принимает решение, что 30 документов релевантны запросу, а 20 нерелевантны.
Сплошной просмотр всей базы данных показывает, что в ней содержится 100
документов, релевантных запросу. Отсюда получаем, что полнота 30/100 = 0,3;
точность 30/50 = 0,6. Как правило, улучшая один из названных параметров,
ухудшаешь другой.
Используется
также такая обобщенная характеристика, как техническая эффективность поисковых
машин, включающая скорость поиска по запросу, объем базы, удобство
представления результатов, скорость индексирования информации и так далее. Но
особое место среди этих параметров занимают показатели качества поиска в этом
сходятся мнения всех создателей поисковых машин.
Отечественная
компьютерная пресса, которая так любит устраивать тестирование лингвистических
программ (например, систем оптического распознавания), пока ни разу не
организовала ни одного тестирования отечественных поисковиков (в отличие от
ZDnet). Научные тестирования поисковиков также представляются недостаточно
объективными, так как используют, к примеру, всего четыре типа запросов (без
учета реальной частоты этих запросов на некоторую поисковую машину). Поэтому
остановимся на исследованиях для оценки точности по методике Н. Харина. Она
используется во время периодических внутрифирменных тестирований поисковых
машин в «Рамблере» группой приглашенных экспертов-лингвистов (обычно,
в течение двух недель каждое). Можно считать это тестирование независимым, так
как его результат не используется заказчиком в маркетинговых целях.
Исследования проводились путем оценки результатов поиска различных поисковиков
по одним и тем же 100 популярным запросам, состоящим из одного, двух, трех и
четырех слов. Важным условием всех исследований были четкие формулировки, какие
именно документы считать релевантными смыслу каждого из запросов (без этого
были бы получены сильно завышенные оценки технической эффективности). Часто
встречающиеся запросы, содержащие ненормативную лексику, не учитывались.
Результаты
иследований представлены ниже. Значения годичной давности оставлены, чтобы
показать изменения эффективности при переходе «Яндекса» на более
совершенную версию поисковой машины в июне 2000 года и изменение точности
«Рамблера», вследствие того, что с ноября 2000 года некоторые
нововведения стали последовательно внедряться в старый движок.
Результаты
для «Апорта», по словам его создателя Евгения Киреева, качественно
похожи на правду, потому что за прошедший год ничего в технологиях повышения
релевантности в этой системе не менялось, так как, по его мнению, ничего уже и
невозможно принципиально изменить. По его словам, команда «Апорта»
спокойно ждет, пока «Яндекс» и «Рамблер» подтянутся до
такого же уровня, и это будет уровнем развития отрасли. Фактически, результаты
последнего исследования от 24 мая 2001 года, проведенные на следующий день
после представления новой версии «Яндекса», показывают, что с
нынешнего лета уровень отрасли определяется им.
Хотя
данные советы даны в качестве «советов по поиску в Яндексе», тем не
менее они применимы к подавляющему большинству поисковых систем, так как все
современные поисковые системы, в своих функциях и возможностях для поиска,
очень похожи.
Проверяйте
орфографию
Если
поиск не нашел ни одного документа, то вы, возможно, допустили орфографическую
ошибку в написании слова. Проверьте правильность написания. Если вы
использовали при поиске несколько слов, то посмотрите на количество каждого из
слов в найденных документах (перед их списком после фразы «Результат
поиска»). Какое-то из слов не встречается ни разу? Скорее всего, его вы и
написали неверно.
Используйте
синонимы
Если
список найденных страниц слишком мал или не содержит полезных страниц,
попробуйте изменить слово. Например, вместо «рефераты» возможно
больше подойдет «курсовые работы» или «сочинения».
Попробуйте задать для поиска три-четыре слова-синонима сразу. Для этого
перечислите их через вертикальную черту (|). Тогда будут найдены страницы, где
встречается хотя бы одно из них. Например, вместо «фотографии»
попробуйте «фотографии | фото | фотоснимки».
Ищите
больше, чем по одному слову
Слово
«психология» или «продукты» дадут при поиске поодиночке
большое число бессмысленных ссылок. Добавьте одно или два ключевых слова,
связанных с искомой темой. Например, «психология Юнга» или
«продажа и покупка продовольствия». Рекомендуем также сужать область
вашего вопроса. Если вы интересуетесь автомобилями ВАЗа, то запросы
«автомобиль Волга» или «автомобиль ВАЗ» выдадут более
подходящие документы, чем «легковые автомобили».
Не
пишите большими буквами
Начиная
слово с большой буквы, вы не найдете слов, написанных с маленькой буквы, если
это слово не первое в предложении. Поэтому не набирайте обычные слова с Большой
Буквы, даже если с них начинается ваш вопрос Яндексу. Заглавные буквы в запросе
рекомендуется использовать только в именах собственных. Например, «группа
Черный кофе«, »телепередача Здоровье».
Найти
похожие документы
Если
один из найденных документов ближе к искомой теме, чем остальные, нажмите на
ссылку «найти похожие документы». Ссылка расположена под краткими
описаниями найденных документов. Яndex проанализирует страницу и найдет
документы, похожие на тот, что вы указали. Но если эта страница была стерта с
сервера, а Яндекс еще не успел удалить ее из базы, то вы получите сообщение
«Запрошенный документ не найден».
Используйте
знаки «+» и «-»
Чтобы
исключить документы, где встречается определенное слово, поставьте перед ним
знак минуса. И наоборот, чтобы определенное слово обязательно присутствовало в
документе, поставьте перед ним плюс. Обратим внимание, что между словом и
знаком плюс-минус не должно быть пробела. Например, запрос «частные
объявления продажа велосипедов» выдаст вам много ссылок на сайты с
разнообразными частными объявлениями. А запрос с «+» «частные
объявления продажа +велосипедов» покажет объявления о продаже именно
велосипедов. Если вам нужно описание Парижа, а не предложения многочисленных
турагентств, имеет смысл задать такой запрос «путеводитель по парижу
-агентство -тур».
Попробуйте
использовать язык запросов
С
помощью специальных знаков вы сможете сделать запрос более точным. Например,
укажите, каких слов не должно быть в документе, или что два слова должны идти
подряд, а не просто оба встречаться в документе. (Описание синтаксиса языка
запросов http://www.yandex.ru/info/syntax.html)
Искать
без морфологии
Вы
можете указать Яндексу не перебирать все словоформы слов из запроса при поиске.
Например, !лукоморья найдет только страницы, цитирующие строчку из
стихотворения Пушкина («У лукоморья дуб зеленый»).
Поиск
картинок и фотографий
Яндекс
умеет искать не только в тексте документа, но и отыскивать картинки по названию
файла или подписи. Для этого на первой странице yandex.ru нажмите ссылку
«расширенный поиск». Для поиска картинки предусмотрены два поля. В
поле «Название картинки» вписываются слова для поиска по названиям картинок,
обычно появляющихся, когда к картинке подводится курсор. Например, название
картинки «Венера» выдаст все страницы с картинками Венеры (всего, что
можно понимать под этим словом).
В
поле «Подпись к картинке» вписывается название файла, содержащего
картинку. Например, запрос dog найдет в Интернете все картинки, в имени файла
которых встречается слово «dog». С большой вероятностью эти картинки
связаны с собаками.
Поисковая
система TELA
адрес
сайта: http://tela.dux.ru
Поисковая
система TELA, созданная петербургским Интернет-провайдером DUX, ориентирована
на поиск русскоязычных страниц в WWW, а также англоязычных страниц на
российских серверах. Сбором страниц занимается подсистема-робот, сделанная на
базе робота MOMspider, а поисковая часть сервера TELA сделана на базе системы
поиска freeWAIS-sf с использованием русской версии системы поддержки морфологии
языка ILIAS. Возможно использование метасимволов, задание слов в любой
словоформе, поиск документов, содержащих все ключевые слова или лишь одно из
них. Проиндексированные документы полностью хранятся на поисковом сервере и
могут быть просмотрены, даже если сервер, с которого они получены, недоступен
или документ удален.
Система
TELA имеет часть, предназначенную для поиска по ключевым словам в русскоязычных
телеконференциях: иерархии relcom, fido7, медицинские телеконференции medlux,
петербургские телеконференции группы spb и др. Предусмотрен отдельный поиск в
каждой из коммерческих телеконференций «Релком» (группы
relcom.commerce.*).
адрес
сайта: http://tela.dux.ru/news.html
Зарубежные
поисковики для русскоязычного пользователя
Среди
поисковиков, в которых можно, задав русский запрос, получить на выдаче
осмысленный ответ, пока еще остается Altavista (или не получивший развития
Raging.com), но в ней русскоязычная база была порушена еще в 1999 году. Сейчас
более или менее полноценными зарубежными искалками по Рунету можно считать лишь
Fast и Google (или Yahoo!), которые предположительно получили себе тех
пользователей, которые ранее искали русскоязычные ресурсы «АльтаВистой».
Говорить о каких-либо долях рынка зарубежных искалок в Рунете до недавнего
времени не имело смысла, а сравнивать с нашими их эффективность и технологии
достаточно уместно http://ricn.ru/neiron/article/?id=489.
Поисковая
система Googlе
История
В
1998 году два студента Стэндфордского университета Сергей Брин и Ларри Пэйдж,
которая уже получила признание. PageRank используемая в Google в основном
основана на link popularity. Т.е. при вычислении релевантности страницы
наибольший вклад имеет количество и качество ссылок на страницы с других
страниц. Сейчас link popularity используется во всех основных поисковых
системах мира (в той или иной степени). Кстати, в русскоязычных поисковых
системах также используется этот параметр, например, в Яндекс, этот параметр называется
индекс цитирования.
Google
добился успеха благодаря этой технологии. Его траффик устойчиво увеличивается
за последние 2 года. В июне 2000 г., такой Интернет-гигант, как Yahoo!, выбрал
Google, как поставщика результатов поиска, вместо Inktomi.
Название
поисковой системы Google было образовано в результате игры букв в слове
«googol». Этим компания хочет подчеркнуть их намерение индексировать
и обрабатывать большие объемы информации.
Размер
По
заявлению Google, на данный момент их база данных насчитывает более
1,346,966,000 проиндексированных страниц.
Международная
поддержка
Вы
можете искать в Google на 10 различных языках. Вы также можете настроить
интерфейс на нужный вам язык. Например, если вы ищите немецкий сайт, то вы
можете вводить запрос на немецком языке, и все вспомогательные надписи
интерфейса будут на немецком языке. Посмотреть список доступных языков вы
можете здесь.
Отличительные
особенности
Очень
удобной функцией является «cache» . Благодаря этой функцией
пользователь может просмотреть проиндексированную страницу даже если эта
страница удалена или сервер, на котором расположена страница недоступен. Вы
также можете использовать эту функцию для исследования ваших конкурентов, это
также помогает лучше понять принцип индексирования страницы поисковым пауком
(роботом).
С
помощью Google можно найти страницы, которые не содержаться в его базе данных.
Это возможно потому что поисковый паук индексирует текст ссылок со страниц.
Поисковая
система AltaVista
Одна
из наиболее популярных поисковых систем Altavista Search появилась в декабре
1995 года. Первоначально она задумывалась как демонстрация мощи 64-разрядного
сервера Alpha APX корпорации Digital Equipment, однако быстро приобрела
самостоятельное значение как эффективное и мощное средство поиска. По последним
данным, на сегодняшний день в индексе Altavista зарегистрировано до 100
миллионов URL. Система поражает своим быстродействием в сутки она обслуживает
более 20 миллионов запросов, при этом она отвечает на запросы незамедлительно,
без всякого «притормаживания». Благодаря таким характеристикам
система используется не только конечными пользователями, но и другими службами
поиска, в частности, каталогом Yahoo. Система обновления индекса краулер
посещает WWW сервера во всем мире, не испытывая проблем с языковым
многообразием, поскольку Altavista поддерживает поиск на 25 языках. Странички,
обновляемые редко, посещаются краулером реже чем популярные и часто
обновляющиеся страницы. К сожалению, автоматически из индекса никогда не
удаляются «мертвые» ссылки, поэтому по некоторым запросам количество
недействующих ссылок может быть довольно велико (до 12 %). Дизайн у системы
простой и удобный в центре экрана находится окно с полем ввода запроса и
кнопками «Search» и «Refine», немного ниже ссылки на
расширенный поиск, помощь, информацию о системе и страницу с настройками.
Сервер не перегружен рекламой и графикой, поэтому все странички загружаются
очень быстро. Даже начинающий пользователь мгновенно освоит технологию
построения простого запроса к Altavist’e. К сожалению, на этом список
преимуществ системы Altavista для неискушенного пользователя заканчивается. На
простой запрос она выдает огромное количество результатов, многие из которых
совершенно не имеют отношения к интересующей пользователя теме, а составление
сложных (расширенных) запросов требует освоения специального языка, что для
многих пользователей неприемлемо. Результаты поиска отсортированы с учетом
частоты встречаемости ключевых слов в документе, учитывается также раздел, в
котором встречается ключевое слово (заголовок, название страницы, и т. д.),
однако не производится сортировка по тематике Altavista попросту не
поддерживает концепцию темы. Поэтому, например, в результатах поиска по слову
Scala будут соседствовать странички, посвященные известной бухгалтерской
программе и странички об одноименной мультимедийной системе. Несколько улучшает
ситуацию с простым поиском имеющаяся в системе Altavista функция Refine
(уточнить). На страничке с результатами поиска нужно нажать Refine, после чего
появится список терминов, которые наиболее часто встречаются в одном контексте
с ключевым словом. Возле каждого термина есть выпадающий список, в котором
можно выбрать, относится ли это слово к теме поиска или нет. После такого
уточнения, как правило, релевантность верхних ссылок в результатах поиска резко
повышается. Из всего вышесказанного следует, что Altavista не является
оптимальным средством для простого поиска. Хотя результат, безусловно, будет
достигнут, затраты времени на его получение будут довольно велики. Сильные
стороны этой системы проявляются, когда пользователю необходимо осуществить
сложный поиск с указанием многих критериев отбора или поиск редких терминов
(например, поиск слова Antropomorphic). В этом случае Altavista предоставляет наиболее
мощные и изощренные средства поиска среди всех рассматриваемых систем, среди
которых такие уникальные средства как поиск документов на конкретном языке,
поиск по названию страницы, поиск среди гиперссылок (можно узнать, например,
есть ли в WWW ссылки на вашу страницу и если есть, то где), поиск объектов
Java/ActiveX, поиск в «якорях» и т.д. Кроме того, Altavista
обеспечивает набор более стандартных, но очень ценных критериев отбора, таких
как логические операции над ключевыми словами, поиск с учетом вариантов
написания слов, поиск целых фраз, поиск документов только на определенных
серверах (или доменах), ограничения по дате создания документа, и т.д. Многие
из этих возможностей доступны даже с основной страницы
Поисковый
каталог Yahoo
Удивительно,
но эта невероятно популярная система, обслуживающая миллионы запросов
ежедневно, зародилась как простая коллекция закладок, которую пополняли всего 2
человека Дэвид Фило и Джерри Янг. На сегодняшний день Yahoo, это уже не
просто каталог, это целая группа разнообразных сервисов, среди которых такие
как каталог Yahooligans Yahoo для детей, система персональных каналов My
Yahoo, бесплатный E-mail сервис, система «Shop with Yahoo» (покупайте
с Yahoo), совместный с MTV проект MTV unfURLed и многое другое. Среди всех
рассмотренных систем, Yahoo единственная чисто каталоговая, на Yahoo нет
собственной поисковой машины. Зато список категорий на Yahoo является наиболее
полным и простым в отличие от других каталогов, на Yahoo всегда легко
определить, в каком разделе находится нужная информация. Заглавная страничка
Yahoo грузится очень быстро хотя на ней очень много ссылок, но все они
текстовые. Центральная часть страницы, конечно, занята окном поиска и списком
категорий. Ссылки вверху страницы (графические) обеспечивают доступ к такой
информации, как «что нового», «что хорошего», «More
Yahoos». Последнюю ссылку рекомендуется посетить она приводит на
страницу с огормным количеством ссылок на разнообразные Yahoo-каталоги и сервисы.
В нижней части основной страницы Yahoo расположено большое количество ссылок на
наиболее популярные разделы Yahoo. При вводе ключевых слов с основной страницы
Yahoo, запрос обрабатывается по методу «Intelligent default», то есть
Yahoo ищет наиболее подходящие результаты в таких областях: в категориях Yahoo;
в Web-сайтах, зарегистрированных на Yahoo; на Altavista (запрос передается при
отсутствии результатов); в новостях. Такой интеллектуальный поиск занимает
довольно много времени. При задании критериев поиска для Yahoo нужно помнить, что
Yahoo ищет эти слова только в названии и описании страницы, поскольку
полнотекстового индекса на Yahoo нет. Поэтому не следует указывать при поиске
слишком много терминов или синонимов количество результатов с Yahoo снизится
или даже будет нулевым. При вводе ключевых слов со страницы каталога, нужно
выбрать область поиска весь каталог Yahoo или только его текущий раздел. Это
делается с помощью радиокнопок под полем ввода. На странице с результатами
поиска выводятся сначала удовлетворяющие критерию поиска категории, а потом
сайты. Возле каждой категории в скобках стоит число это количество сайтов в
данной категории. В случае если на Yahoo нет результатов, сразу выводятся
результаты с Altavista. Вверху и внизу страницы выводится маленькая табличка, с
помощью которой можно одним нажатием кнопки мыши произвести поиск в категориях
Yahoo, на Altavista, в новостях и событиях. Количество результатов поиска на
Yahoo, естественно, невелико, зато большинство из них являются релевантными.
Возможна проблема с отсутствующими страницами, поскольку вебмастера обычно
забывают удалить свои сайты с поисковых систем, а на Yahoo нет механизма
автоматического обновления. Для расширенного поиска Yahoo предлагает не очень
большой, но очень полезный набор инструметов. Чтобы попасть на страничку
расширенного поиска, надо перейти по ссылке «options» с основной
страницы Yahoo. Среди средств расширенного поиска ограничение результатов по
дате, поиск в Yahoo, Usenet и среди E-mail адресов, использование логических операций
над терминами и поиск конкретной фразы. Также присутствует возможность искать
слова с произвольными окончаниями, указывать слова, которые должны или НЕ
должны присутствовать в документе, и т.д. Чисто русские ресурсы в Yahoo не
добавляются, потому что в Yahoo Inc. просто некому смотреть и оценивать их
содержимое. Но те запросы, которые не дали результатов на Yahoo передаются на
Altavista, а там есть хороший индекс русских ресурсов.
Или
вот некоторые характеристики узла InfoSeek
В
качестве его аппаратной базы используется восьмипроцессорный компьютер Sun
Microsystems Ultra Enterprise 4000 с 2Гбайт оперативной памяти (данные на конец
1998 года). Для разработчиков это далеко не предел, и они планировали в
ближайшем будущем довести оперативную память до 14Гбайт. Столь мощное
аппаратное обеспечение уже позволяет обрабатывать до тысячи полнотекстовых
запросов в секунду, поэтому UltraSeek относится к числу самых быстрых поисковых
систем Internet (к сожалению, в России это не всегда заметно).
Дисковое
пространство составляет порядка 400 Гбайт. Это сразу позволило кардинально
расширить объем базы данных, доведя ее более чем до 50 млн страниц в
полнотекстовом режиме. По этому показателю InfoSeek превосходит AltaVista
(более 31 млн). Помимо объема базы данных, для поисковых систем последнего
поколения ключевое значение имеют возможности формирования запроса.
Краткая
характеристика языка запросов системы InfoSeek .
Поисковый
синтаксис системы InfoSeek, т. е. набор команд (операторов) для указания
отношений между вводимыми терминами, хотя и относительно прост, но в то же
время достаточен для формирования очень точного запроса. Основные операции, как
правило, те же, что и в других поисковых системах, но синтаксис имеет некоторые
ососбенности. Знаком «+» помечается термин, присутствие которого в
документе обязательно, а «-» ставится перед словом, появление
которого должно быть исключено. Если возникает потребность отыскать несколько
вариантов названия одного и того же предмета или близких терминов, при их
перечислении следует употреблять запятые, которые в этом случае равносильны
оператору ИЛИ. InfoSeek допускает также поиск терминов, которые должны стоять
вплотную друг к другу. Для этого расположенные рядом слова соединяются дефисом
в единую цепочку без пробелов: 21st-century-information-resources. Система,
чувствительная к употреблению заглавных и строчных букв, способна
самостоятельно вычленять имена собственные, будь то имена людей или названия
организаций, если они написаны с заглавных букв. Усечение окончаний вводимых
терминов не допускается, однако морфологический механизм К дополнительным
возможностям составления поискового предписания относится способность
ограничивать поисковое пространство названием страницы или ее адресом. Для
этого в начале запроса вводится слово title: или url:, а затем без пробела
следуют искомые термины, например title:computerweek.
«Интеллектуальный
уровень» системы во многом определяется тем, насколько точно, взвешенно и
комфортно для пользователя она выдает результаты поиска.
InfoSeek
обладает в этом смысле достаточно развитым механизмом выдачи найденных ссылок.
Их перечень дается в порядке релевантности запросу. При этом система
искусственного интеллекта на основании количества и местонахождения искомых
лексических единиц в документе определяет уровень соответствия в процентах.
InfoSeek
предоставляет также ряд мелких услуг, которые являются побочными результатами
деятельности поискового робота. Например, можно узнать, сколько ссылок в Web
приходится на конкретную страницу, т. е. степень ее популярности, или же,
наоборот, выяснить, сколько ссылок на внешние страницы имеется на данном
Web-узле, а также получить данные о том, сколько Web-узлов содержат
определенный термин в адресе или названии. Полезна возможность поиска в
Internet логотипов и изображений на различную тематику. Для этого в режиме
ImageSeek вводится обозначение предмета, и система выдает соответствующие
картинки. Например на запрос «football» было получено 36 фотографий,
на которых запечатлены моменты этой популярной игры. Все перечисленные функции
реализуются через специальное меню, расположенное слева от основной строки
запроса.
За
счет всего этого интерфейс InfoSeek служит неплохой отправной точкой для любых
действий, связанных с поиском информации, что заметно облегчает жизнь пользователям.
Все перечисленные сервисные возможности, конечно же, добавляют ценности всему
Web-узлу InfoSeek.
Раздел 3
Анализ ресурсов Интернета по вопросу:
Формирование имиджа фирмы и компании
Сегодня
трудно найти периодическое издание, в каждом выпуске которого не встретилось бы
слово «Интернет». Интерес к сети вызван огромными возможностями,
которые технический прогресс предоставил нам в конце второго тысячелетия. Об
Интернете пишут все от бульварной прессы до серьезных деловых изданий. Информация,
размещенная в сети Интернет, становится основой новостей на телеканалах,
сетевые технологии привлекают экспертов по размещению капиталов и бизнесменов
всех уровней. Забавные, невероятные и просто интересные случаи, связанные с
Интернетом обсуждаются даже в кругу людей, ни разу не сидевших у монитора
персонального компьютера. Рассказы о злобных хакерах и гигантских прибылях
компаний, занимающихся электронной коммерцией передаются из уст в уста,
перепечатываются десятками изданий, часто обрастая массой неточностей,
преувеличений и просто несуразностей.
Общаясь
в кругу предпринимателей, можно убедиться, насколько далеки они от этого… А
жаль… Ведь западные компании уже давно поставили Интернет на службу своему
бизнесу. Не хватает серьезных материалов на тему создания и развития он-лайн
бизнеса, нет интереса к этому у «серьезных людей» старше 40 лет. В
украинском Интернете редко встретишь основных участников тяжеловесных отраслей
бизнеса, таких как импорт-экспорт. Интернет остается уделом молодых. И потому
встречаются до сих пор легковесные рекомендации новоявленных экспертов по
заработкам в сети, прочитав которые, обычный пользователь думает, что из этого
и состоит весь он-лайн бизнес.
Так
для чего же и как можно использовать Интернет? Интернет можно и нужно использовать
для получения прибыли, для PR-акций, для рекламы, формирования имиджа
компании или продвижение отдельных торговых марок с помощью
Интернет-представительств словом, для каждодневного бизнеса.
В
первую очередь, конечно, развитие Интернет-технологий это звездный час для
малого бизнеса. В виртуальном мире о компании судят исключительно по качеству
ее сайта, а также по информационному «шуму», который его сопровождает
(под «шумом» подразумевается обсуждение в телеконференциях и списках
рассылки, а также в сетевых обзорах). Суперофис в центре города, дорогие
печатные брошюры и огромные бюджеты отдела общественных связей все эти
дорогостоящие атрибуты из мира Большого Бизнеса в сетевой среде не имеют ни
малейшего значения, здесь своя система ценностей и свои критерии оценки имиджа.
Если пользователи Интернета являются вашими потенциальными клиентами, вам могут
не понадобиться ни офис, ни печатная реклама на разворотах для того, чтобы
преуспеть в бизнесе, а стоимость средств сетевого маркетинга и работы с
общественностью в пересчете на одного клиента окажется на порядок ниже, чем при
использовании других СМИ.
Основные
клиенты в Интернет
Это,
конечно, прежде всего, крупные промышленные предприятия, включая разработчиков
высоких технологий, фирмы производители компьютеров и оргтехники, нефтяные
компании, фармацевтические компании, предприятия здравоохранения, финансовые
учреждения и банки. Множество малых предприятий и частных предпринимателей
пользуются услугами Интернет через недорогих посредников. Само слово Интернет
за последние три года стало символом. Более 54 Торговых Марок, содержащих слово
Интернет зарегистрировано в Службе Патентов и Торговых Марок США. К примеру,
это Торговые Марки систем электронной обработки данных для финансовых служб, центров
обучения и консультаций и компьютерных коммуникаций.
Следует
понимать, что, вкладывая деньги в рекламу, рекламодатель не всегда стремится
«продать». Иногда целью является «развитие» имиджа фирмы
или товара? Помните, что стоимость фирмы Sony, например, значительно выше
суммарной стоимости ее помещений, офисов и оборудования. Если вы захотите
купить эту фирму (или торговую марку), вам придется заплатить большую часть
стоимости за фирменный знак и название вы покупаете имидж. Понятно теперь,
что реклама это не только способ продать «сегодня», но еще и способ
накопить капитал в виде торговой марки!
Методы
развития фирменного или товарного имиджа
Развивается только имидж фирмы, подразумевается, что у потенциального
потребителя нужно сформировать мысль: «все, что продает фирма с таким
названием, имеет высокое качество и приемлемую цену». Деньги
вкладываются в рекламу фирмы, в развитие фирменного знака фирмы. Подходит для
супермаркетов, оптовых фирм, в основном, предприятий торговли.