GeoSELECT.ru



Программирование / Реферат: Стратегия поиска в автоматизированных информационных системах (Программирование)

Космонавтика
Уфология
Авиация
Административное право
Арбитражный процесс
Архитектура
Астрология
Астрономия
Аудит
Банковское дело
Безопасность жизнедеятельности
Биология
Биржевое дело
Ботаника
Бухгалтерский учет
Валютные отношения
Ветеринария
Военная кафедра
География
Геодезия
Геология
Геополитика
Государство и право
Гражданское право и процесс
Делопроизводство
Деньги и кредит
Естествознание
Журналистика
Зоология
Инвестиции
Иностранные языки
Информатика
Искусство и культура
Исторические личности
История
Кибернетика
Коммуникации и связь
Компьютеры
Косметология
Криминалистика
Криминология
Криптология
Кулинария
Культурология
Литература
Литература : зарубежная
Литература : русская
Логика
Логистика
Маркетинг
Масс-медиа и реклама
Математика
Международное публичное право
Международное частное право
Международные отношения
Менеджмент
Металлургия
Мифология
Москвоведение
Музыка
Муниципальное право
Налоги
Начертательная геометрия
Оккультизм
Педагогика
Полиграфия
Политология
Право
Предпринимательство
Программирование
Психология
Радиоэлектроника
Религия
Риторика
Сельское хозяйство
Социология
Спорт
Статистика
Страхование
Строительство
Схемотехника
Таможенная система
Теория государства и права
Теория организации
Теплотехника
Технология
Товароведение
Транспорт
Трудовое право
Туризм
Уголовное право и процесс
Управление
Физика
Физкультура
Философия
Финансы
Фотография
Химия
Хозяйственное право
Цифровые устройства
Экологическое право
   

Реферат: Стратегия поиска в автоматизированных информационных системах (Программирование)



КАЗАНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ КУЛЬТУРЫ И ИСКУССТВ

Кафедра информатики



Вступительный реферат по теме:


Стратегия поиска в Автоматизированных информационно-поисковых системах



Выполнил:
Султанов Ильнур Ильдусович



Казань, 2004
Содержание

Введение 3
Проблемы поиска информации 5
Поисковые алгоритмы 7
Оценка качества 16
Дополнительные возможности предоставляемые поисковыми машинами 18
Лингвистика 20
Заключение 22
Список литературы 23
Глоссарий: 24



Введение

Проблема поиска и сбора информации - одна из важнейших проблем
информационно поисковых систем. Конечно, нельзя сравнивать в этом
отношении, скажем, средние века, когда поиск информации был проблемой
потому, что этой информации было мало, и требовались усилия только для
того, чтобы найти хоть что-то по более или менее значительному
интересующему вопросу. Проблема поиска информации приобрела новый характер
в 20-м столетии, с началом развития века информационных технологий. Теперь
она заключается не в том, что информации мало и поэтому ее трудно найти, а
в том, что ее теперь наоборот становится все больше и больше, и от этого
найти ответ на интересующий вопрос может оказаться тоже довольно сложной
задачей [2].
Так, сначала появилась возможность пойти в библиотеку и, потратив там
время на выбор нужной книги по каталогу, найти необходимую информацию. Но
каталоги не решают полностью проблем поиска информации даже в рамках одной
библиотеки, так как в каталожную запись входит относительно мало
информации: заголовок, автор, место издания и т.п. Проблема поиска
информации значительно усложняется при использование виртуальных
источников. Здесь используется технология онлайновых каталогов, в
результате применения которой пользователь имеет возможность выполнять
поиск в каталогах сразу нескольких библиотек, чем, на самом деле, еще
больше усложняет себе задачу, но, с другой стороны, увеличивает шансы
решить ее [1].
На современном этапе все информационное пространство, в котором мы
живем, все больше погружается в Интернет. Интернет становится основной
формой существования информации, не отменив традиционных, такие как
журналы, радио, телевидение, телефон, всевозможные справочные службы.
В данной работе объектом исследования является Автоматизированная
информационно поисковая система. Это система где хранится информационный
массив, из которого пользователю выдается нужная информация,
осуществляющаяся либо автоматически, либо вручную.
Предмет исследования включает в себя те свойства, стороны и отношения
объекта исследования, которые необходимо изучить. Предмет обозначает
границы, в пределах которых объект изучается в данном конкретном
исследовании. Предметом исследования является стратегия информационного
поиска.
Цель исследования: Цель исследования ставится, обзор и выявление
поисковых сервисов (возможностей предоставляемые на сегодняшний день),
написание рекомендации к проведению поиска, анализ развития поисковых
систем.
Для выполнения поставленной цели в рамках исследования необходимо
решение следующих задач:
1. аналитический обзор поисковых систем;
2. определение механизма поиска в поисковых системах;
3. создание информационной системы, по АИПС;
4. оценка эффективности созданной системы;
5. разработка рекомендаций к проведению поиска используя информационную
систему.

Проблемы поиска информации

Ключ проблемы заключается в том, что выросло количество пользователей
не обладающие профессиональными навыками при поиске информации на языке
запросов. Естественно с такой проблемой столкнулся не только интернет, но и
электронные библиотеки (ЭБ) и электронные каталоги (ЭК). К таким системам
относятся библиотеки НЭБ-НСН, Интегрум - Техно в России, Лексис-Нексис,
Рейтер на Западе.
Более строгая организация каталогов в библиотеках, полное единство
форматов (или почти полное) внутри одной библиотеки не является решением
проблемы современных поисковых систем. Поиск это искусство. Ясно, что в
области искусства нельзя добиться гарантированного, или массового
результата.
Существует убеждение, что каждое новое поколение программ поиска
совершенней предыдущего. И иная точка зрения, что «все новое - это хорошо
забытое старое». Думаю, что применительно к поисковым системам истина лежит
где-то посередине.
Но что же поменялось в действительности за последние годы? Не алгоритмы
и не структуры данных, не математические модели. Поменялась парадигма
использования систем. Системой поиска стали пользоваться пользователи не
имеющие профессиональные навыки.
Особенно поисковые системы стали востребованы с возникновением
интернета. В процессе эволюции поисковых систем, стали очевидны следующие
изменения. Во-первых, люди не только «думают словами», но и «ищут словами».
В ответе системы они ожидают увидеть слово, набранное в строке запроса.
Второе: «человека ищущего» трудно «переучить искать», так же как трудно
переучить говорить или писать. Научная мысль 60-х – 80-х об итеративном
уточнении запросов, о понимании естественного языка, о поиске по смыслу, о
генерации связного ответа на вопрос, пока не удаётся создать и не
выдерживает критики.


Поисковые алгоритмы


Как и любая программа, поисковая система оперирует со структурами
данных и исполняет алгоритм. Есть четыре класса поисковых алгоритмов. Три
алгоритма из четырех требуют «индексирования», предварительной обработки
документов, при котором создаются вспомогательный файл, сиречь «индекс»,
призванный упростить и ускорить сам поиск. Это алгоритмы инвертированных
файлов, суффиксных деревьев, сигнатур. В вырожденном случае предварительный
этап индексирования отсутствует, а поиск происходит при помощи
последовательного просмотра документов. Такой поиск называется прямым.


Прямой поиск

Ниже представлена простейшая его версия знакома многим.

|char* strstr(char *big, |ПРЯМОЙ ПОИСК ТЕКСТА. |
|char *little) { |В этой функции языка C текст |
|char *x, *y, *z; |строки big просматривают |
|for (x = big; *x; x++) { |слева направо и для каждой |
|for (y = little, z = x; |позиции x запускают |
|*y; ++y, ++z) |последовательное сравнение с |
|{ |искомой подстрокой little. |
|if (*y != *z) |Для этого, двигая |
|break; |одновременно два указателя y |
|} |и z, попарно сравнивают все |
|if (!*y) |символы. Если мы успешно |
|return x; |дошли до конца искомой |
|} |подстроки, значит она |
|return 0; |найдена! |
|} | |
| | |


Несмотря на кажущуюся простоту, последние 30 лет прямой поиск
интенсивно развивается. Было выдвинуто немалое число идей, сокращающих
время поиска в разы. При этом надо учесть, что новые алгоритмы и их
улучшенные варианты появляются постоянно.
Хотя прямой просмотр всех текстов – довольно медленное занятие, не
следует думать, что алгоритмы прямого поиска не применяются в интернете.
Норвежская поисковая система Fast (www.fastsearch.com) использовала чип,
реализующий логику прямого поиска упрощенных регулярных выражений, и
разместила 256 таких чипов на одной плате. Это позволяло Fast-у обслуживать
довольно большое количество запросов в единицу времени.
Кроме того, есть масса программ, комбинирующих индексный поиск для
нахождения блока текста с дальнейшим прямым поиском внутри блока. Например,
весьма популярный, в том числе и в Рунете, glimpse.
У прямых алгоритмов есть положительные черты. Например, неограниченные
возможности по приближенному и нечеткому поиску. Ведь любое индексирование
всегда сопряжено с упрощением и нормализацией терминов, а, следовательно, с
потерей информации. Прямой же поиск работает непосредственно по
оригинальным документам безо всяких искажений.

Инвертированный файл

Эта простейшая структура данных. Первая категория людей знает, что это
такое, по «конкордансам» - алфавитно упорядоченным исчерпывающим спискам
слов из одного текста или принадлежащих одному автору (например «Конкорданс
к стихам А. С. Пушкина», «Словарь-конкорданс публицистики Ф. М.
Достоевского»). Вторые имеют дело с той или иной формой инвертированного
списка всякий раз, когда строят или используют «индекс БД по ключевому
полю».
Проиллюстрируем эту структуру при помощи замечательного русского
конкорданса - «Симфонии», выпущенной московской патриархией по тексту
синодального перевода Библии [симфония].



Рис. 1
Перед нами упорядоченный по алфавиту список слов. Для каждого слова
перечислены все «позиции», в которых это слово встретилось. Поисковый
алгоритм состоит в отыскании нужного слова и загрузке в память уже
развернутого списка позиций.
Чтобы сэкономить на дисковом пространстве и ускорить поиск, обычно
прибегают к двум приемам. Во-первых, подробность самой позиции. Чем
подробнее задана такая позиции, например, в случае с «Симофонией» это
«книга+глава+стих», тем больше места потребуется для хранения
инвертированного файла.
В наиподробнейшем варианте в инвертированном файле можно хранить и
номер слова, и смещение в байтах от начала текста, и цвет и размер шрифта,
да много чего еще. Чаще же просто указывают только номер документа, скажем,
книгу Библии, и число употреблений этого слова в нем. Именно такая
упрощенная структура считается основной в классической теории
информационного поиска – Information Retrieval (IR).
Второй (никак не связанный с первым) способ сжатия: упорядочить позиции
для каждого слова по возрастанию адресов и для каждой позиции хранить не
полный ее адрес, а разницу от предыдущего. Вот как будет выглядеть такой
список для нашей странички в предположении, что мы запоминаем позицию
вплоть до номера главы:
ЖЕНЩИНА: [Быт.1],[+11],[0],[+2],[+4],[+2],[+4],..
Дополнительно на разностный способ хранения адресов накладывают какой-
нибудь способ упаковки: зачем отводить небольшому целому числу
фиксированное «огромное» количество байт, ведь можно отвести ему почти
столько байт, сколько оно заслуживает. Здесь уместно упомянуть коды Голомба
или встроенную функцию популярного языка Perl: pack(“w”).
В литературе встречается и более тяжелая система упаковочных алгоритмов
самого широкого спектра: арифметический, Хафман, LZW, и т.д. Прогресс в
этой области идет непрерывно. На практике в поисковых системах они
используются редко: выигрыш невелик, а мощности процессора расходуются
неэффективно.
В результате всех описанных ухищрений размер инвертированного файла,
как правило, составляет от 7 до 30 процентов от размера исходного текста, в
зависимости от подробности адресации.
занесены в «Красную книгу»
Неоднократно предлагались другие, отличные от инвертированного и
прямого поиска алгоритмы и структуры данных. Это, прежде всего, суффиксные
деревья, а также сигнатуры.
Первый из них функционировал и в интернете, будучи запатентованным
алгоритмом поисковой ситемы OpenText.
Мне доводилось встречать суффиксные индексы в отечественных поисковых
системах.
Второй - метод сигнатур - представляет собой преобразование документа к
поблочным таблицам хеш-значений его слов - "сигнатуре" и последовательному
просмотру "сигнатур" во время поиска.
Широкого распространения эти два метода не получили.

МАТЕМАТИЧЕСКИЕ МОДЕЛИ
Приблизительно 3 из 5 поисковых систем и модулей функционируют безо
всяких математических моделей. Их разработчики не ставят перед собой задачу
реализовывать абстрактную модель. Принцип здесь: лишь бы программа хоть что-
нибудь находила.
Как только речь заходит о повышении качества поиска, о большом объеме
информации, о потоке пользовательских запросов, кроме эмпирически
проставленных коэффициентов полезным оказывается оперировать каким-нибудь
пусть и несложным теоретическим аппаратом. Модель поиска – это некоторое
упрощение реальности, на основании которого получается формула (сама по
себе никому не нужная), позволяющая программе принять решение: какой
документ считать найденным и как его ранжировать. После принятия модели
коэффициенты приобретают физический смысл и становятся понятней.
Все многообразие моделей традиционного информационного поиска (IR)
принято делить на три вида: теоретико-множественные (булевская, нечетких
множеств, расширенная булевская), алгебраические[1][1] (векторная,
обобщенная векторная, латентно-семантическая, нейросетевая) и
вероятностные.
Булевское семейство моделей самое известное, реализующие полнотекстовый
поиск. Есть слово - документ считается найденным, нет – не найденным.
Собственно, классическая булевская модель – это мостик, связывающий теорию
информационного поиска с теорией поиска и манипулирования данными.
Критика булевской модели, вполне справедливая, состоит в ее крайней
жесткости и непригодности для ранжирования. Поэтому еще в 1957 году Joyce и
Needham (Джойс и Нидхэм) предложили учитывать частотные характеристики
слов, чтобы «... операция сравнения была бы отношением расстояния между
векторами...».
Векторная модель и была с успехом реализована в 1968 году отцом-
основателем науки об информационном поиске Джерардом Солтоном (Gerard
Salton)[2][2] в поисковой системе SMART (Salton's Magical Automatic
Retriever of Text). Ранжирование в этой модели основано на естественном
статистическом наблюдении, что чем больше локальная частота термина в
документе (TF) и больше «редкость» (т.е. обратная встречаемость в
документах) термина в коллекции (IDF), тем выше вес данного документа по
отношению к термину. Обозначение IDF ввела Karen Sparck-Jones (Карен Спарк-
Джоунз) в 1972 в статье про различительную силу (term specificity). С этого
момента обозначение TF*IDF широко используется как синоним векторной
модели.
Наконец, в 1977 году Robertson и Sparck-Jones (Робертсон и Спарк-
Джоунз) обосновали и реализовали вероятностную модель (предложенную еще в
1960), также положившую начало целому семейству. Релевантность в этой
модели рассматривается как вероятность того, что данный документ может
оказаться интересным пользователю. При этом подразумевается наличие уже
существующего первоначального набора релевантных документов, выбранных
пользователем или полученных автоматически при каком-нибудь упрощенном
предположении. Вероятность оказаться релевантным для каждого следующего
документа рассчитывается на основании соотношения встречаемости терминов в
релевантном наборе и в остальной, «нерелевантной» части коллекции. Хотя
вероятностные модели обладают некоторым теоретическим преимуществом, ведь
они располагают документы в порядке убывания "вероятности оказаться
релевантным", на практике они так и не получили большого распространения.
Важно заметить, что в каждом из семейств простейшая модель исходит из
предположения о взаимонезависимости слов и обладает условием фильтрации:
документы, не содержащие слова запроса, никогда не бывают найденными.
Продвинутые («альтернативные») модели каждого из семейств не считают слова
запроса взаимонезависимыми, а, кроме того, позволяют находить документы, не
содержащие ни одного слова из запроса.

Поиск «по смыслу»
Способность находить и ранжировать документы, не содержащие слов из
запроса, часто считают признаком искусственного интеллекта или поиска по
смыслу и относят априори к преимуществам модели.
Для примера опишу лишь одну, самую популярную модель, работающую по
смыслу. В теории информационного поиска данную модель принято называть
латентно-семантически индексированием (иными словами, выявлением скрытых
смыслов). Эта алгебраическая модель основана на сингулярном разложении
прямоугольной матрицы, ассоциирующей слова с документами. Элементом матрицы
является частотная характеристика, отражающая степень связи слова и
документа, например, TF*IDF. Вместо исходной миллионно-размерной матрицы
авторы метода, предложили использовать 50-150 «скрытых смыслов»[3][3],
соответствующих первым главным компонентам ее сингулярного разложения.
Доказано, что если оставить в рассмотрении первые k сингулярных чисел
(остальные приравнять нулю), мы получим ближайшую из всех возможных
аппроксимацию исходной матрицы ранга k (в некотором смысле ее «ближайшую
семантическую интерпретацию ранга k»). Уменьшая ранг, мы отфильтровываем
нерелевантные детали; увеличивая, пытаемся отразить все нюансы структуры
реальных данных.
Операции поиска или нахождения похожих документов резко упрощаются, так
как каждому слову и каждому документу сопоставляется относительно короткий
вектор из k смыслов (строки и столбцы соответствующих матриц). Однако по
причине малой ли осмысленности «смыслов», или по какой иной[4][4], но
использование LSI в лоб для поиска так и не получило распространения. Хотя
во вспомогательных целях (автоматическая фильтрация, классификация,
разделение коллекций, предварительное понижение размерности для других
моделей) этот метод, по-видимому, находит применение.

Оценка качества


Какова бы ни была модель, поисковая система нуждаетсяв «тюнинге» - оценке
качества поиска и настройке параметров. Оценка качества – идея,
фундаментальная для теории поиска. Ибо именно благодаря оценке качества
можно говорить о применимости или не применимости той или иной модели и
даже обсуждать их теоретичеcкие аспекты.
В частности, одним из естественных ограничений качества поиска служит
наблюдение, вынесенное в эпиграф: мнения двух «асессоров» (специалистов,
выносящих вердикт о релевантности) в среднем не совпадают друг с другом в
очень большой степени! Отсюда вытекает и естественная верхняя граница
качества поиска, ведь качество измеряется по итогам сопоставления с мнением
асессора.
Обычно[5][5] для оценки качества поиска меряют два параметра:
. точность (precision) – доля релевантного материала в ответе поисковой
системы
. полнота (recall) – доля найденных релевантных документов в общем числе
релевантных документов коллекции
Именно эти параметры использовались и используются на регулярной основе
для выбора моделей и их параметров в рамках созданной Американским
Интститутом Стандартов (NIST) конференции по оценке систем текстового
поиска (TREC - text retrival evaluation conference)[6][6]. Начавшаяся в
1992 году консорциумом из 25 групп, к 12-му году своего существования
конференция накопила значительный материал, на котором до сих пор
оттачиваются поисковые системы. К каждой очередной конференции готовится
новый материал (т.н. «дорожка») по каждому из интересующих направлений.
«Дорожка» включает коллекцию документов и запросов. Приведу примеры:
. Дорожка произвольных запросов (ad hoc) – присутствует на всех
конференциях
. Многоязычный поиск
. Маршрутизация и фильтрации
. Высокоточный поиск (с единственным ответом, выполняемый на время)
. Взаимодействие с пользователем
. Естестственно-языковая «дорожка»
. Ответы на «вопросы»
. Поиск в «грязных» (только что отсканированных) текстах
. Голосовой поиск
. Поиск в очень большом корпусе (20GB, 100GB и т.д.)
. WEB корпус (на последних конференциях он представлен выборкой по
домену .gov)
. Распределенный поиск и слияние результатов поиска из разных систем



Дополнительные возможности предоставляемые поисковыми машинами


Как видно из «дорожек» TREC, к самому поиску тесно примыкает ряд задач,
либо разделяющих с ним общую идеологию (классификация, маршрутизация,
фильтрация, аннотирование), либо являющихся неотъемлемой частью поискового
процесса (кластеризация результатов, расширение и сужение запросов,
обратная связь, «запросо-зависимое» аннотирование, поисковый интерфейс и
языки запросов). Нет ни одной поисковой системы, которой бы не приходилось
решать на практике хотя бы одну из этих задач.
Зачастую наличие того или иного дополнительного свойства является
решающим доводом в конкурентной борьбе поисковых систем. Например, краткие
аннотации состоящие из информативных цитат документа, которыми некоторые
поисковые системы сопровождают результаты соей работы, помогают им
оставаться на полступеньки впереди конкурентов.
Обо всех задачах и способах их решения рассказать невозможно. Для
примера рассмотрим «расширение запроса», которое обычно производится через
привлечение к поиску ассоциированных терминов. Решение этой задачи возможно
в двух видах – локальном (динамическом) и глобальном (статическом).
Локальные техники опираются на текст запроса и анализируют только
документы, найденные по нему. Глобальные же «расширения» могут оперировать
тезаурусами, как априорными (лингвистическими), так и построенными
автоматически по всей коллекции документов. По общепринятому мнению,
глобальные модификации запросов через тезаурусы работают неэффективно,
понижая точность поиска. Более успешный глобальный подход основан на
построенных вручную статических классификациях, например, ВЕБ-директориях.
Этот подход широко использутся в интернет-поисковиках в операциях сужения
или расширения запроса.
Нередко реализация дополнительных возможностей основана на тех же самых
или очень похожих принципах и моделях, что и сам поиск. Сравните, например,
нейросетевую поисковую модель, в которой используется идея передачи
затухающих колебаний от слов к документам и обратно к словам (амплитуда
первого колебания – все тот же TF*IDF), с техникой локального расширения
запроса. Последняя основанна на обратной связи (relevance feedback), в
которой берутся наиболее смыслоразличительные (контрастные) слова из
документов, принадлежащих верхушке списка найденного.
К сожалению, локальные методы расширения запроса, несмотря на эффектные
технические идеи типа «Term Vector Database» и очевидную пользу, все еще
остаются крайне дорогими.


Лингвистика


Немного в стороне от статистических моделей и структур данных стоит
класс алгоритмов, традиционно относимых к лингвистическим. Точно границы
между статистическим и лингвистическими методами провести трудно. Условно
можно считать лингвистическими методы, опирающиеся на словари
(морфологические, синтаксические, семантические), созданные человеком. Хотя
считается доказанным, что для некоторых языков лингвистические алгоритмы не
вносят существенного прироста точности и полноты (например, английский),
все же основная масса языков требует хотя бы минимального уровня
лингвистической обработки. Приведу только список задач, решаемый
лингвистическими или окололингвистическими приемами:
. автоматическое определение языка документа
. токенизация (графематический анализ): выделение слов, границ
предложений
. исключение неинформативных слов (стоп-слов)
. лемматизация (нормализация, стемминг): приведение словоизменительных
форм к «словарной». В том числе и для слов, не входящих в словарь
системы
. разделение сложных слов (компаундов) для некоторых языков (например,
немецкого)
. дизамбигуация: полное или частичное снятие омонимии
. выделение именных групп
Еще реже в исследованиях и на практике можно встретить алгоритмы
словообразовательного, синтаксического и даже семантического анализа. При
этом под семантическим анализом чаще подразумевают какой-нибудь
статистический алгоритм (LSI, нейронные сети), а если толково-комбинаторные
или семантические словари и используются, то в крайне узких предметных
областях.

Заключение


Прежде всего, очевидно, что поиск в большом информационном массиве, не
может быть сколько-нибудь корректно выполнен, будучи основан на анализе
одного лишь текста документа. Ведь внетекстовые (off-page) факторы играют
порой и большую роль, чем текст самой страницы. Положение на сайте,
посещаемость, авторитетность источника, частота обновления, цитируемость
страницы и ее авторов – все эти факторы играют важную роль.
Cтав основным источником получения справочной информации для человека,
поисковые системы стали основным источником трафика для интернет -сайтов.
Как следствие, они немедленно подверглись «атакам» недобросовестных
авторов, желающих оказаться в первых страницах результатов поиска.
Искусственная генерация входных страниц, насыщенных популярными словами,
техника клоакинга, «слепого текста» и многие другие приемы, предназначенные
для обмана поисковых систем.
Кроме проблемы корректного ранжирования, создателям поисковых систем
пришлось решать задачу обновления и синхронизации колоссальной по размеру
коллекции с гетерогенными форматами, способами доставки, языками,
кодировками, массой бессодержательных и дублирующихся текстов. Необходимо
поддерживать базу в состоянии максимальной свежести, может быть учитывать
индивидуальные и коллективные предпочтения пользователей. Многие из этих
задач никогда прежде не рассматривались в традицонной науке информационного
поиска.

Список литературы


1. Ашманов И. С. Национальные особенности поисковых систем // Журнал
"Компьютер в школе", № 01, 2000 год // Издательство "Открытые системы"
(www.osp.ru)
2. Антонов А.В., Мешков В.С. Аналитические проблемы поисковых систем и
«лингвистические анализаторы» // НТИ.Сер.1.- 2000.- №6.-С.1-5
3. Войскунский В.Г. Оценка функциональной эффективности документального
поиска: и размытые шкалы оценка пертинентности // НТИ. Сер. 2.- 1992.-
№5.-С.19-27
4. Кноп К. Поиск в Интернете как хроническое заболевание // Мир Internet.
- 2002. - N 10. - С. 33-35
5. Конжаев А. Стратегия информационного поиска // http://www.msiu.ru.
6. Попов С. Поиск информации и принятие решения // НТИ. Сер.2.-2001.-№1.-
С.1-4
7. Степанов В.К Русскоязычные поисковые механизмы в Интернет //
ComputerWorld Россия.-1997.-N11.-C.37-40.
8. Сегалович И. Как работают поисковые системы // Мир Internet. - 2002. -
N 10. - С. 24-32


Глоссарий:


++ асессор (assesor, эксперт) – специалист в предметной области,
выносящий заключение о релевантности документа, найденного поисковой
системой

++ булевская модель (boolean, булева, булевая, двоичная) – модель
поиска, опирающаяся на операции пересечения, объединения и вычитания
множеств

++ векторная модель – модель информационного поиска, рассматривающая
документы и запросы как векторы в пространстве слов, а релевантность как
расстояние между ними

++ вероятностная модель – модель информационного поиска,
рассматривающая релевантность как вероятность соответствия данного
документа запросу на основании вероятностей соответствия слов данного
документа идеальному ответу

++ внетекстовые критерии (off-page, вне-страничные) – критерии
ранжирования документов в поисковых системах, учитыващие факторы, не
содержащиеся в тексте самого документа и не извлекаемые оттуда никаким
образом

++ входные страницы (doorways, hallways) – страницы, созданные для
искусственного повышения ранга в поисковых системах (поискового спама). При
попадании на них пользователя перенаправляют на целевую страницу

++ дизамбигуация (tagging, part of speech disambiguation, таггинг) –
выбор одного из нескольких омонимов c помощью контекста; в английском языке
часто сводится к автоматическому назначению грамматической категории «часть
речи»

++ дубликаты (duplicates) – разные документы с идентичным, с точки
зрения пользователя, содержанием; приблизительные дубликаты (near
duplicates, почти-дубликаты), в отличие от точных дубликатов, содержат
незначительные отличия

++ иллюзия свежести – эффект кажущейся свежести, достигаемый поисковыми
системами в интернете за счет более регулярного обхода тех документов,
которые чаще находятся пользователями

++ инвертированный файл (inverted file, инверсный файл, инвертированный
индекс, инвертированный список) – индекс поисковой системы, в котором
перечислены слова коллекции документов, а для каждого слова перечислены все
места, в которых оно встретилось

++ индекс (index, указатель) – см. индексирование

++ индекс цитирования (citation index) – число упоминаний (цитирований)
научной статьи, в традиционной библиографической науке рассчитывается за
промежуток времени, например, за год

++ индексирование (indexing, индексация) – процесс составления или
приписывания указателя (индекса) – служебной структуры данных, необходимой
для последующего поиска

++ информационный поиск (Information Retrieval, IR) – поиск
неструктурированной информации, единицой представления которой является
документ произвольных форматов. Предметом поиска выступает информационная
потребность пользователя, неформально выраженная в поисковом запросе. И
критерий поиска, и его результаты недетермированы. Этими признаками
информационный поиск отличается от «поиска данных», который оперирует
набором формально заданных предикатов, имеет дело со структурированной
информацией и чей результат всегда детерминирован. Теория информационного
поиска изучает все составляющие процесса поиска, а именно, предварительную
обработку текста (индексирование), обработку и исполнение запроса,
ранжирование, пользовательский интерфейс и обратную связь.

++ клоакинг (cloaking) – техника поискового спама, состоящая в
распознании авторами документов робота (индексирующего агента) поисковой
системы и генерации для него специального содержания, принципиально
отличающегося от содержания, выдаваемого пользователю

++ контрастность термина – см. различительная сила

++ латентно-семантическое индексирование – запатентованный алгоритм
поиска по смыслу, идентичный факторному анализу. Основан на сингулярном
разложении матрицы связи слов с документами

++ лемматизация (lemmatization, нормализация) – приведение формы слова
к словарному виду, то есть лемме

++ накрутка поисковых систем – см. спам поисковых систем

++ непотизм – вид спама поисковых систем, установка авторами документов
взаимных ссылок с единственной целью поднять свой ранг в результатах поиска

++ обратная встречаемость в документах (inverted document frequency,
IDF, обратная частота в документах, обратная документная частота) –
показатель поисковой ценности слова (его различительной силы); обратная
говорят, потому что при вычислении этого показателя в знаменателе дроби
обычно стоит число документов, содержащих данное слово

++ обратная связь – отклик пользователей на результат поиска, их
суждения о релевантности найденных документов, зафиксированные поисковой
системой и использующиеся, например, для итеративной модификации запроса.
Следует отличать от псевдо-обратной связи – техники модификации запроса, в
которой несколько первых найденных документов автоматически считаются
релевантными

++ омонимия – см. полисемия

++ основа – часть слова, общая для набора его словообразовательных и
словоизменительных (чаще) форм

++ поиск по смыслу – алгоритм информационного поиска, способный
находить документы, не содержащие слов запроса

++ поиск похожих документов (similar document search) – задача
информационного поиска, в которой в качестве запроса выступает сам документ
и необходимо найти документы, максимально напоминающие данный

++ поисковая система (search engine, SE, информационно-поисковая
система, ИПС, поисковая машина, машина поиска, «поисковик», «искалка») –
программа, предназначенная для поиска информации, обычно текстовых
документов

++ поисковое предписание (query, запрос) – обычно строчка текста

++ полисемия (polysemy, homography, многозначность, омография,
омонимия) - наличие нескольких значений у одного и того же слова

++ полнота (recall, охват) – доля релевантного материала, заключенного
в ответе поисковой системы, по отношению ко всему релевантному материалу в
коллекции

++ почти-дубликаты (near-duplicates, приблизительные дубликаты) – см.
дубликаты

++ прюнинг (pruning) – отсечение заведомо нерелевантных документов при
поиске с целью ускорения выполнения запроса

++ прямой поиск – поиск непосредственно по тексту документов, без
предварительной обработки (без индексирования)

++ псевдо-обратная связь – см. обратная связь

++ различительная сила слова (term specificity, term discriminating
power, контрастность, различительная сила) – степень ширины или узости
слова. Слишком широкие термины в поиске приносят слишком много информации,
при это существенная часть ее бесполезна. Слишком узкие термины помогают
найти слишком мало документов, хотя и более точных.

++ регулярное выражение (regualr expression, pattern, «шаблон», реже
«трафарет», «маска») – способ записи поискового предписания, позволяющий
определять пожелания к искомому слову, его возможные написания, ошибки и
т.д. В широком смысле – язык, позволяющий задавать запросы неограниченной
сложности

++ релевантность (relevance, relevancy) – соответствие документа
запросу

++ сигнатура (signature, подпись) – множество хеш-значений слов
некоторого блока текста. При поиске по методу сигнатур все сигнатуры всех
блоков коллекции просматриваются последовательно в поисках совпадений с хеш-
значениями слов запроса

++ словоизменение (inflection) – образование формы определенного
грамматического значения, обычно обязательного в данном грамматическом
контексте, принадлежащей к фиксированному набору форм (парадигме),
характерного для слов данного типа. В отличие от словообразования никогда
не приводит к смене типа и порождает предсказуемое значение. Словоизменение
имен называют склонением (declension), а глаголов – спряжением
(conjugation)

++ словообразование (derivation) – образование слова или основы из
другого слова или основы. Чаще приводит к смене типа и к образованию слов,
имеющих идеосинкразическое значение

++ смыслоразличительный – см. различительная сила

++ спам поисковых систем (spam, спамдексинг, накрутка поисковых систем)
– попытка воздействовать на результат информационного поиска со стороны
авторов документов

++ статическая популярность – см. PageRank

++ стемминг – поцесс выделения основы слова

++ стоп-слова (stop-words) – те союзы, предлоги и другие частотные
слова, которые данная поисковая система исключила из процесса
индексирования и поиска для повышения своей производительности и/или
точности поиска

++ суффиксные деревья, суффиксные массивы (suffix trees, suffix arrays,
PAT-arrays) – индекс, основанный на представлении всех значимых суффиксов
текста в структуре данных, известной как бор (trie). Суффиксом в этом
индексе называю любую «подстроку», начинающуюся с некоторой позиции текста
(текст рассматривается как одна непрерывная строка) и продолжающуюся до его
конца. В реальных приложениях длина суффиксов ограничена, а индексируются
только значимые позиции – например, начала слов. Этот индекс позволяет
выполнять более сложные запросы, чем индекс, построенный на инвертированных
файлах

++ токенизация (tokenization, lexical analysis, графематический анализ,
лексический анализ) – выделение в тексте слов, чисел, и иных токенов, в том
числе, например, нахождение границ предложений

++ точность (precision) - доля релевантного материала в ответе
поисковой системы

++ хеш-значение (hash-value) – значение хеш-функции (hash-function),
преобразующей данные произвольной длины (обычно, строчку) в число
фиксированного порядка

++ частота (слова) в документах (document frequency, встречаемость в
документах, документная частота) – число документов в коллекции, содержащих
данное слово

++ частота термина (term frequency, TF) – частота употреблений слова в
документе

++ шингл – (shingle) – хеш-значение непрерывной последовательности слов
текста фиксированной длины

++ PageRank – алгоритм расчета статической (глобальной) популярности
страницы в интернете, назван в честь одного из авторов - Лоуренса Пейджа.
Соответствует вероятности попадания пользователя на страницу в модели
случайного блуждания
++ TF*IDF – численная мера соответствия слова и документа в векторной
модели; тем больше, чем относительно чаще слово встретилось в документе и
относительно реже в коллекции


-----------------------
[1] В отечественной литературе алгебраические модели часто называют
линейными
[2] Gerard Salton (Sahlman) 1927-1995. Он же Селтон, он же Залтон и даже
Залман, он же Жерар, Герард, Жерард или даже Джеральд в зависимости от
вкуса переводчика и допущенных опечаток
http://www.cs.cornell.edu/Info/Department/Annual95/Faculty/Salton.html

http://www.cs.virginia.edu/~clv2m/salton.txt

[3] для больших коллекций число «смыслов» увеличивают до 300
[4] После наших экспериментов с LSI получилось, что «смысл номер 1» в
Рунете - все англоязычные документы, «смысл номер 3» – все форумы и т.п.
[5] но не обязательно – есть и «альтернативные» метрики!
[6] материалы конференции публично доступны по адресу
trec.nist.gov/pubs.html

-----------------------

|Consistency checking has shown that the |
|overlap of relevant documents between any|
|two assesors is on the order of 40% on |
|average…cross-assesor recall and |
|precision of about 65% …This implies a |
|practical upper bound on retrieval system|
|performance of 65% …[7][1] |
|Donna Harman |
|What we have learned, and not learned, |
|from TREC [harman] |
| |



|Сингулярным разложением действительной|
|матрицы A размеров m*n называется |
|всякое ее разложение вида A = USV, где|
|U - ортогональная матрица размеров |
|m*m, V - ортогональная матрица |
|размеров n*n, S - диагональная матрица|
|размеров m*n, элементы которой sij= 0,|
|если i не равно j, и sii = si >= 0. |
|Величины si называются сингулярными |
|числами матрицы и равны арифметическим|
|значениям квадратных корней из |
|соответствующих собственных значений |
|матрицы AAT. В англоязычной литературе|
|сингулярное разложение принято |
|называть SVD-разложением. |


[pic]







Реферат на тему: Струйные принтеры

План


Введение
История создания
Типы и модели
Устройства
Принцип работы
Программное обеспечение
Интерфейс
Разъемы, порты
Заключение


Введение

Что бы ни говорили о превосходстве электронных носителей информации
над бумажными, похоже, век бумаги и печатного текста пройдет еще не скоро.
Давно известно, что напечатанный текст воспринимается совершенно иначе, чем
его «электронная» копия на экране монитора. И до того светлого дня, когда
безбумажный стандарт информации восторжествует и нам больше не придется
переводить на бумагу весело шумящие леса...
Мы будем печатать. А значит, что старина принтер останется таким же
неизменным атрибутом любого офиса и даже квартиры.
За последние пару лет в принтерном мире произошла настоящая
революция. Бывшие некогда дорогой игрушкой струйные принтеры по цене
«скатились» до уровня комплекта из хорошей мыши и клавиатуры. Примитивные,
скрежетавшие на всю комнату игольчатые, матричные принтеры канули в Лету.
Того и гляди, стандартом станут лазерные принтеры.
Струйные, лазерные, матричные... Что стоит за каждым из этих
терминов? А стоит ни много, ни мало — целая эпоха...
Матричные принтеры появились в эпоху, когда никто всерьез и не
задумывался о серьезной работе с графикой. Практически все компьютеры
работали в символьном режиме. А это значит, что точно таким же узким
набором стандартных печатных символов оперировал и принтер.
Матричные принтеры назывались еще и игольчатыми. Их печатающее
устройство содержало в себе некоторое число (9 или 25) иголок, которые
выскакивали из головки и наносили удар по красящей ленте, похожей на
машинописную. От удара иголочки на бумаге оставалась точка. А комбинация
иголочек давала символ — букву или цифру.
В основном, конечно, матричные принтеры были черно-белыми. Однако
довольно скоро появились и их цветные коллеги, работавшие с многоцветной
печатной лентой. Такие уже неплохо справлялись и с графикой, выдавая
полноцветные картинки...
Матричные принтеры были достаточно быстрыми — быстрее, чем многие из
современных струйных принтеров. Недорогими в эксплуатации. И — страшно
шумными. Верещание и скрежет принтера могли превратить в инвалида
умственного труда даже самого крепкого работника — не в этом ли причина
того, что эти устройства при первой же возможности «сошли со сцены»,
уступив место принтерам нового поколения — струйным.
Струйные принтеры. Время символов ушло. Наступила эпоха Windows —
эпоха графики, красивых картинок, ярких, четких, типографского качества
шрифтов. И на арену вышел новый тип принтеров — струйные. Печатным
устройством в этом принтере были уже не иголки и красящая лента, а емкость
со специальными чернилами, которые выбрызгивались на бумагу из миниатюрных
дырочек-сопел под большим давлением. На бумаге оставалась крохотная
капелька, диаметр которой был в десятки раз меньше, чем диаметр точки от
матричного принтера. Соответственно гораздо более четкими и реалистичными
стали выдаваемые этим принтером картинки — качество отпечатков последних
моделей нетрудно перепутать с отпечатанными в типографии. И при этом
струйные принтеры практически не шумели!
Были (и есть до сих пор) у «струнников» и недостатки. Во-первых,
скорость. Печать одной страницы текста на струйном принтере занимает от 30
секунд до 1—2 минут, а картинкии того дольше. Во-вторых, стоимость печати
на струйном принтере до сих пор остается высокой: с учетом расхода чернил и
стоимости специальной бумаги она составляет 10—25 центов за лист. А главное
— стоило капнуть на лист со «струйной» распечаткой каплю воды, чтобы
чернила сразу же поплыли, образовав безобразную кляксу.



История создания

Методу струйной печати уже почти сто лет. Лорд Рейли, лауреат
нобелевской премии по физике, сделал свои фундаментальные открытия в
области распада струй жидкости и формирования капель еще в прошлом веке,
датой рождения технологии струйной печати можно считать только 1948 год.
Именно тогда шведская фирма Siemens Elema подала патентную заявку на
устройство, работающее как гальванометр, но оборудованное не измерительной
стрелкой, а распылителем, с помощью которого регистрировались результаты
измерений.
И даже теперь, спустя почти полвека, эта гениально простая система
печати применяется, например, в медицинских приборах. Правда, жидкостный
осциллограф способен печатать лишь кривые, а не тексты и графики. Эта
эффективная схема была усовершенствована, и появился новый струйный
принтер, функционирующий по принципу непрерывного распыления красителя или
печати под высоким давлением.
Разработчики воспользовались закономерностью, выявленной лордом
Рейли : струя жидкости стремится распасться на отдельные капли. Нужно
только чуть подправить случайный процесс распадения струи, накладывая с
помощью пьезоэлектрического преобразования на струю красителя,
выбрасываемую под высоким давлением (до 90 бар), высокочастотные колебания
давления.
Таким способом может выбрасываться до миллиона капель в секунду. Их
размеры зависят от геометрической формы сопел-распылителей и составляют
всего лишь несколько микрон, а скорость, с которой они долетают до бумаги,
достигает 40 м/с.
Благодаря высокой скорости полета капель допускается использовать
поверхности с сильными неровностями и в зависимости от требований к
качеству печати размещать их на расстоянии 1-2 см от сопла-распылителя. В
результате можно наносить маркировку, например данные о сроке годности
товара на картонные коробки, бутылки, консервные банки, яйца или кабели.
Эту технологию печати нетрудно узнать по точкам, кажущимся неравномерными и
как бы обтрепанными.
С начала 70-х годов необычайно активизировалась исследовательская
деятельность, направленная на создание систем без недостатков, свойственных
системам печати под высоким давлением. Первое решение, найденное
специалистами - печатающие головки с пьезоэлектрическими преобразователями,
испускающие по запросу отдельные капли красителя.


Типы и модели

Печатающие устройства с исполнительными пьезоэлектрическими
механизмами.
Первые заявки на регистрацию изобретения систем струйной печати с
исполнительными пьезоэлектрическими механизмами были поданы в 1970 и 1971
гг. На протяжении нескольких лет различные фирмы и институты проводили
фундаментальные исследования, пока, наконец, компании Siemens не удалось
облечь этот принцип в приемлемую для рынка форму. В 1977 г. Был
продемонстрирован первый струйный принтер с дозированным выбросом
красителя. Этот принтер, оснащенный двенадцатью соплами-распылителями и
печатающий почти бесшумно со скоростью 270 символов в секунду, произвел
революцию даже в кругах специалистов.
Siemens в качестве электромеханического преобразователя использовала
пьезоэлектрическую трубочку, вмонтированную в канал из литьевой смолы. Все
каналы заканчиваются пластиной с калиброванными отверстиями для распыления,
расположенной на передней стороне устройства. Передача электроэнергии и
красителя производится исключительно посредством колебаний давления,
распространяющихся в канале в соответствии с законами акустики. Колебания,
достигающие конца канала, отражаются там с инверсией фазы, т.е. в этом
месте колебание с пониженным давлением и наоборот.

Пьезопластины.

В начале 1985 г. компания Epson представила первый из своих
пьезопланарных струйных принтеров.
Вместо пьезоэлектрических трубочек, как у Siemens, на печатающих
головках Epson, выполненных из структурированных стеклянных пластинок,
укреплены небольшие пьезопластинки. Если к ним приложить электрическое
напряжение, их диаметр чуть-чуть изменится, но и этого будет достаточно,
чтобы они согнулись вместе с пассивной стеклянной многослойной подложкой
подобно биметаллической пластине, что приведет к возникновению в канале
красителя выталкиваются тем же способом, что и в печатающих головках с
пьезотрубочками.
В 1987 г. компания Dataproducts предложила другой принцип
использования пьезоэлектриков для струйной печати, основанный на применении
пластинчатого пьезопреобразователя. В последующие годы этот метод оставался
сравнительно малоизвестным причем не столько из-за конструкции на базе
преобразователя, сколько из-за жидких восковых чернил, которые применялись
во всех струйных принтерах с пластинчатым пьезопреобразователем
производства Epson
Согласно этому методу пьезопреобразователь, представляющий собой
длинную плоскую пластинку (ламель), размещается позади небольшого
резервуара с красителем. При воздействии на ламель импульсов напряжения ее
длина немного меняется, что приводит к всплескам давления внутри
резервуара, которые, в свою очередь, выталкивают капли из сопла-
распылителя.
Пластинчатые пьезопреобазователи сочетают в себе преимущества как
плоских, так и трубчатых систем высокую частоту распыления и компактную
конструкцию. Сегодня на печатающие головки с пьезоламелями делают ставку
такие фирмы, как Dataproduts, Tektronix и Epson.
В начале 1994 года Epson продемонстрировал пьезотехнологию MACH
(Multilayer Actuator Head - головка с многоуровневым исполнительных
механизмом). Тем не менее и в пьезоэлектрических печатающих головках MACH-
головках применяются пьезоламели. Правда, компании Epson удалось изготовить
пьезоламели одного ряда сопел-распылителей в едином блоке (Multilayer).
Таким образом оказалось возможным еще уменьшить размеры печатающей головки,
разместить преобразователи, каналы и сопла-распылители с меньшей дистанцией
и одновременно снизить производственные расходы.

Печатающие устройства с термографическими исполнительными
механизмами.
В 1985 году сенсацию вызвал Thinkjet компании Hewlett-Packard -
первый струйно-пузырьковый термопринтер. Метод пузырьково-струйной
термопечати за несколько лет покорил рынок (количество проданных струйных
термопринтеров составило 10 млн.)
В чем же революционность этой технологии? Как часто бывает в
подобных случаях, достижением стало сокращение производственных расходов.
Если пьезоэлектрические печатающие механизмы приходилось с большим или
меньшим трудом собирать из множества отдельных деталей, то пузырьково-
струйные печатающие головки, представляющие собой кристаллы на кремниевых
подложках, изготавливались по тонкослойной технологии сотнями.
При тонкослойной технологии применяются в принципе те же
производственные процессы, что и при изготовлении интегральных схем. Каналы
подачи красителя, сопла-распылители, исполнительные механизмы и
токоподводящие шины возникают при поочередном нанесении слоев на подложки,
например способом ионно-лучевого напыления, и последующем структурировании
этих слоев.
Таким образом, по завершении процесса производства, насчитывающего
более сотни шагов, на одной подложке появляется очень много термопечатающих
элементов. Все структуры должны быть выполнены с точностью до тысячной доли
миллиметра. Кроме того, малейшее загрязнение при производстве приводит к
отказу. По этой причине пузырьково-струйные печатающие элементы
изготавливаются в чистых помещениях и с применением машин, типичных для
полупроводниковой промышленности.
Поскольку головки струйно-пузырьковой термопечати изготавливаются по
тому же принципу, что и интегральные микросхемы, напрашивается мысль об
интеграции последних в печатающие кристаллы. И первый шаг в этом
направлении сделала фирма Canon, встроив в печатающие головки своих
принтеров транзисторную матрицу. Примеру Canon последовала компания Xerox,
выпустившая в 1993 году модель пузырьково-струйного принтера с головкой,
оборудованной 128 распылителями, и полностью интегрированным
последовательно-параллельным преобразователем.
Функционирование пузырьково-струйного сопла-распылителя:
Сначала сильный импульс напряжения длительностью 3-7 мкс подается на
крохотный нагревательный элемент, который мгновенно накаляется до 500 гр.
Цельсия. На его поверхности температура превышает 300 гр. Цельсия. Мощность
нагрева поверхности настолько велика, что при увеличении длительности
импульса напряжения всего лишь на несколько микросекунд нагревательный
элемент моментально бы разрушился.
Сразу же в тонкой пленке над нагревательным элементом начинают
кипеть чернила, и через 15 мкс образуется закрытый пузырек пара высокого
давления (до 10 бар). Он выталкивает каплю чернил из сопла-распылителя, при
чем скорость полета капли достигает 10 м/с и более. Через 40 мкс пузырек,
соединившись с атмосферой, опять опадает, однако пройдет еще 200 мкс, пока
новые чернила под действием капиллярных сил не будут засосаны из
резервуара.
С самого начала пузырьково-струйные печатающие головки делились на
две группы. Компания Canon, изобретатель системы, предпочла вариант
Edlgeshooter. Почти одновременно фирма Hewlett-Packard разработала головку
типа Sidechooter, которую теперь изготавливает и компания Olivetti.
Головка Edgeshooter, как становится ясно уже из названия,
разбрызгивает чернильные капли "за угол", т.е. перпендикулярно к
направлению образования пузырьков. В головке Sideshooter, где пластина с
соплами-распылителями находится поверх нагревательных элементов и каналов
подачи чернил, пузырьки и капли движутся в одном направлении. Поскольку
края сопел-распылителей в головках типа Sideshooter сделаны из однородного,
а не из различных материалов, как в Edgeshooter, процесс изготовления
распылителей с отверстиями определенного размера для Sideshooter
значительно проще, чем для головок Edgeshooter. Кроме того, приходится
учитывать неодинаковое смачивание разнородной поверхности головки
Edgeshooter.
Требования к качеству чернил для любой системы струйной термопечати
очень высоки, значительно выше, чем пьезосистемах. Принцип функционирования
и высокие температуры обусловливают применение только смешанных растворимых
красителей на водяной основе.
Красители должны соответствовать целому ряду требований:
- быть совместными с материалами, из которых сделан печатающий
механизм;
- не образовывать отложений в каналах и распылителях, а также не
расслаиваться;
- храниться в течении длительного времени;
- обладать определенными показателями плотности, вязкости и
поверхностного натяжения при температурах от 10 до 40 гр. Цельсия;
- ну служить питательной средой для образования бактерий и
водорослей;
- не содержать ядовитых или канцерогенных веществ и не возгораться.
К тому же красители для струйной термопечати должны образовывать
пузырьки пара без отложения осадков и выдерживать кратковременное
нагревание до 350 гр. Цельсия.
И так мы видим, что способ струйной печати, зародившийся около 50
лет назад, - относительно молодая технология. Вполне вероятно, что струйные
принтеры завоюют массовый рынок, вытесняя, таким образом, матричные
принтеры. Если же разработчикам удастся повысить разрешение и скорость
печати струйных принтеров, то изготовителям лазерных принтеров придется
всерьез побороться за место на рынке.
До сих пор никакой другой метод печати не порождал такого
разнообразия вариантов, как струйная печать, при чем не подлежит сомнению
что возможность этой технологии еще долго не будет исчерпана.
Как устроен струйный принтер

Струйный принтер является дальнейшим развитием идеи матричного
принтера, поэтому в его конструкции сохранены многие из элементов
предшественника.
Главным элементом струйного принтера является печатающая головка.
Печатающая головка состоит из большого количества сопел, к которым
подводятся чернила. Чернила подаются к соплам за счет капиллярных свойств и
удерживаются от вытекания за счет сил поверхностного натяжения жидкости. В
головку встроен специальный механизм, позволяющий выбрасывать из сопла
микроскопическую капельку чернил. В зависимости от устройства этого
механизма различают принадлежность принтера к тому или иному классу.
В струйных принтерах используется один из двух методов выбрасывания
чернильных капель:
Пьезоэлектрический (Epson);
Метод газовых пузырьков (Canon, НР).
В основе пьезоэлектрической технологии лежит способность
пьезоэлемента деформироваться под воздействием электрического поля. В
каждое сопло печатающей головки встроена плоская мембрана, изготовленная из
пьезокристалла. Под воздействием электрического импульса мембрана
деформируется, а создаваемое при этом давление выбрасывает из сопла
микроскопическую каплю чернил.
В основе метода газовых пузырьков лежит быстрое нагревание
небольшого объема до температуры кипения. Скорость нагрева столь велика,
что она подобна взрывному процессу. Образующийся при этом пар выбрасывает
из сопла микроскопическую каплю чернил. Для реализации этого метода в
каждое сопло встраивается микроскопический нагревательный элемент.
Каждый из этих двух способов по-своему привлекателен, однако каждый
из них не свободен и от недостатков.
. Пьезоэлектрическая технология наиболее дешевая, отличается более
высокой надежностью (т. к. не используется высокая температура). Этот
способ управления менее инерционен, чем нагрев, что позволяет повысить
скорость печати.
. Пузырьковая технология связана с высокой температурой. При высокой
температуре нагреватель со временем покрывается слоем нагара, поэтому
в принтерах, использующих эту технологию, печатающая головка довольно
часто выходит из строя. В таких случаях она вместе с резервуаром для
чернил образует конструктивный единый узел.
Печатающие головки могут конструктивно объединяться с чернильным
картриджем и заменяться одновременно с ним, а могут быть установлены в
принтере постоянно - при этом заменяется только картридж. Каждый из этих
вариантов имеет свои достоинства и недостатки. Казалось бы, что чернильная
емкость без печатающей головки должна стоить намного дешевле, чем в
комбинации с печатающей головкой. На деле этого не происходит и заметного
удешевления эксплуатации при постоянно установленной в принтере печатающей
головки не наблюдается. В то же время, легко сменная печатающая головка
позволяет легко выйти из затруднений, связанных с засыханием чернил в ее
каналах. Следует помнить, что если чернила засохнут в головке, то ее, как
правило, следует менять, если своевременно не будут приняты соответствующие
меры. Для того, чтобы уменьшить риск засыхания чернил в каналах головки,
предусматривается специальное положение парковки. В большинстве принтеров
предусмотрена функция очистки сопел. Тем не менее, все это не дает полной
уверенности, что при эксплуатации печатающую головку не придется менять.

Головка вместе с емкостями для чернил закрепляется на каретке,
которая по специальной направляющей совершает возвратно-поступательное
движение поперек листа бумаги. Хотя способ "объединения печатающей головки
и емкости для чернил конструктивно наиболее прост и в силу этого получил
самое широкое распространение, он не является оптимальным. Дело в том, что
каретка должна достаточно быстро двигаться, а также достаточно быстро
изменять направление движения, ибо скоростью ее движения определяется
скорость печати. Для этого подвижная каретка должна быть мало инерционной,
т. е. иметь возможно меньшую массу. С этой целью уменьшают объем емкости
для чернил. Поэтому, предпочтительнее оказывается размещение емкости для
чернил на неподвижной части принтера, а подачу чернил к печатающим головкам
осуществлять с помощью специальных трубопроводов.
Такая система позволяет повысить скорость печати и одновременно
увеличить емкости для чернил, однако система трубопроводов конструктивно
столь сложна, что такая конструкция используется очень редко.
В процессе печати лист бумаги перемещается вдоль тракта печати при
помощи специального механизма. Его основу составляет обрезиненный валик,
приводимый во вращение шаговым двигателем. К валику бумага прижимается
вспомогательными обрезиненными роликами. Протяжка происходит за счет сил
трения при повороте валика. В старых конструкциях принтеров бумага для
печати заправлялась в принтер полистно. Это было очень неудобно, так как
при печати многостраничных документов требовалось постоянное присутствие
оператора только для того, чтобы вкладывать в принтер очередной лист бумаги
и повторно запускать процесс печати. В современных принтерах процесс подачи
бумаги автоматизирован. В приемный лоток принтера можно заложить перед
началом печати стопку бумаги, очередной лист из которой по мере
необходимости автоматически будет захватываться, и подаваться в печатный
тракт. Количество листов бумаги, которое может быть заложено в приемный
лоток в разных моделях

Новинки рефератов ::

Реферат: Брестский мир (История)


Реферат: Метод наблюдения (Социология)


Реферат: Принятие христианства на Руси (Религия)


Реферат: Сердобский район (География)


Реферат: Дипозитные счета (Менеджмент)


Реферат: Билеты по предмету ОСНОВЫ СТАНДАРТИЗАЦИИ, СЕРТИФИКАЦИИ И МЕТРОЛОГИИ за весенний семестр 2001 года (Технология)


Реферат: Международная организация труда (Менеджмент)


Реферат: Электролитная обработка полосы (Металлургия)


Реферат: Роль дидактических игр в развитии элементарных математических представлений дошкольника (Педагогика)


Реферат: Zusammenspiel der Realiatete als eines der Hauptprinzipien des Sujetaufbaus im Roman "Stiller" von Max Frisch (Иностранные языки)


Реферат: Расчёт зубчатых и червячных передач (Технология)


Реферат: Производство пластических масс (Технология)


Реферат: Философия (Философия)


Реферат: Реализм в Европе 19в. (Культурология)


Реферат: Модемы: назначение, сравнительный анализ моделей, принцип работы, эксплуатация на примере конкретной модели (Программирование)


Реферат: Гос политика в БЖД основные принципы (Безопасность жизнедеятельности)


Реферат: Лауреаты нобелевской премий по физике (Физика)


Реферат: Партизанское движение в произведение Л. Н. Толстого "Война и мир" (Литература)


Реферат: История распада СССР (Политология)


Реферат: Проблема подготовки педагогических кадров к инновационной деятельности (Педагогика)



Copyright © GeoRUS, Геологические сайты альтруист