Спецхран

Постигая Великий алгоритм творчества, мы научились эффективно изыскивать в мировой компьютерной сети материалы, и теперь самое время задуматься об их правильном хранении. Роль идеального информационного контейнера на Пути ГО выполняет программа MyBase, о которой и поговорим сегодня.

MyBase — штука китайская (разработчик — Wjjsoft) и внешне совсем неброская. Поэтому пользователю-новичку немудрено повестись на пестрые рекламные заманухи напористых бледнолицых конкурентов и пройти мимо этой удивительной программы. Непростительная ошибка! Объясню, почему.

MyBase относится к довольно распространенной категории так называемых аутлайнеров [1] — программ для хранения данных в иерархической древовидной структуре. Самым известным аутлайнером слывет TreePad — истый старожил, переваливший за седьмой релиз: компания FreeByte корпит над своим детищем уже десяток лет! Завидное постоянство, поражающее воображение настойчивым и удивительным непопаданием в «яблочко» Data Mining — искусства сбора, хранения и анализа информации, из-за которого, собственно, и заварилась вся каша. Каких только удивительных и ненужных «фич» не добавили разработчики TreePad за истекшее десятилетие: и криптозащиту, и проверку орфографии, и — апофеоз! — автоматический набор телефонных номеров. Разумеется, я утрирую: TreePad — миленькая утилита, вполне charmant и comme il faut, уверен, она найдет своего пользователя. Однако для Великого алгоритма TreePad, увы, не годится, поскольку не умеет напрямую взаимодействовать с браузером, который бесспорно является сегодня центровым информационным бульдозером. Поясняю: 99% материалов мы получаем из Интернета, поэтому логично ожидать от аутлайнера максимально эффективного перехвата (одним кликом мыши!) данных прямо из браузера. Вы не поверите, но TreePad этого не умеет! Импортировать любую графику, текстовый файл, гиперссылку и закладку умеет, а работать напрямую с браузером — увы и ах! Для того чтобы портировать данные в TreePad, сначала нужно сохранить их на жестом диске, потом запустить мастер подсказок и еще полчаса кликать мышью (рис. 1).

[[wysiwyg_imageupload:431:]]

В процессе серьезного Data Mining вам придется иметь дело с десятками и даже сотнями веб-страниц и документов, поэтому данный подход совершенно неприемлем: натрете на мыши мозоли. Справедливости ради скажем, что неумение взаимодействовать с браузером напрямую (что важнее всех проверок орфографии и автодозвонов вместе взятых) свойственно не только лучшему из лучших TreePad’у, но и остальным аутлайнерам (наш соотечественник Maple Professional, который чистотой своего кода и вылизанностью интерфейса даст солидную фору TreePad’у, не исключение), кроме… сорокапятиградусного [2] MyBase!

Взаимодействие между MyBase и MS Internet Explorer (надеюсь, вы не страдаете пуэрильным комплексом неполноценности и пользуетесь именно этим, хоть и «мастдайным» [3], но, безусловно, лучшим браузером, а не маргинальными поделками типа «Мозиллы», «Оперы» и прочих неудачников) осуществляется с помощью вспомогательной утилиты Web Collect. Далее я прекращаю пытку теорией и перехожу к приемам наглядной агитации.

Итак, вы устанавливаете MyBase и Web Collect, после чего в контекстном меню браузера (по нажатии правой кнопки мыши!) появляются две новые опции — Save To MyBase и Save Image To MyBase (рис. 2).

[[wysiwyg_imageupload:432:]]

Вы можете сохранить в иерархическую базу данных MyBase либо веб-страницу целиком, либо выделенную часть этой страницы, либо изображение (image). Чрезвычайно удобно, что программа позволяет сохранять текст как в формате html, так и в виде чистого текста (plain text), рис. 3.

[[wysiwyg_imageupload:433:]]

Диалоговое окно Web Collect, которое вы видите на скриншоте, появляется после того, как вы выбираете любую опцию (Save To MyBase, Save Image To MyBase) изконтекстногоменю. Следующий шаг — создание самой иерархической базы данных. Для экономии времени (читатель помнит, что наша изыскательская работа протекает в условиях нечеловеческого цейтнота!) удобнее всего создавать базу данных прямо из Web Collect при портировании [4] первой информации. Предположим, мы приступили к просеиванию документов, которые получили после запроса в поисковой системе HighBeam (см. предыдущий «Путь ГО»). Как и повсюду сегодня в Интернете, на каждой странице HighBeam полощется куча баннеров и прочей рекламной шелухи. Ясен перец, вся эта параферналия нам не нужна в информационной базе данных, поэтому чаще всего мы будем сохранять в MyBase именно выделенные части, а не страницы целиком: захватываем нужный участок экрана — правая кнопка мыши — опция Save To MyBase — в закладке Options (она открывается первой в Web Collect по умолчанию) выбираем Selected HTML Text (выделенный текст html) и далее переключаемся на закладку Database, чтобы создать новую базу данных (либо использовать старую, если вы создали ее ранее в самой программе MyBase), рис. 4.

[[wysiwyg_imageupload:434:]]

Как видите, у меня аналитических баз данных уже изрядное количество. В этом окне вы можете портировать только что схваченную информацию в уже существующую базу (кнопка Add, и далее выбираете на жестком диске), либо создать новую (кнопка New). По мере наполнения базы документами может возникнуть необходимость размещать новые веб-страницы в определенном месте древовидной иерархии. Конечно, вы всегда сможете перетасовать записи базы данных непосредственно в MyBase, однако ради ускорения процесса Data Mining опять же лучше делать это прямо из «бульдозера» Web Collect — закладка Outline (рис. 5).

[[wysiwyg_imageupload:435:]]

В терминологии MyBase принята традиционная терминология иерархии: sibling — запись, находящаяся на одинаковом уровне с активной (той, что выделена в настоящий момент курсором; см. скриншот), и subitem — подчиненная запись. Та или иная опция задается в закладке Outline с помощью кнопок New Sibling, New Sub либо галочки на As sub item (ввести данные в виде подчиненной записи относительно той, что активна на экране).

Итак, не теряя времени, мы обрабатываем один за другим все документы, полученные в процессе сбора информации, и портируем их в нашу базу данных через Web Collect. Когда работа завершена, самое время порадоваться результатам: запускаем MyBase и любуемся (рис. 6).

[[wysiwyg_imageupload:436:]]

На скриншоте — малая часть информационной базы данных, которую я создал для аналитической статьи о Daewoo и Ким Ву Чуне. О том, куда дальше заведет нас Путь ГО, вы узнаете в следующей колонке.


[1] Outline — как ни пытался я приспособить все официальные переводы (контур, краткий обзор, очертания, план, схема), так и не сумел добиться мало-мальского соответствия реальности. В результате пришлось взять грех на душу и оставить слово без перевода («аутлайнер»). Одно утешение: нашему многострадально-флективному языку, не поспевающему за бурно развивающимся информационным миром, не впервой.

[2] Не сумел-таки удержаться, чтобы не проехаться по происхождению замечательной программы: «сорокапятиградусник» (Forty-Fiver) — американское прозвище китайских товарищей (по углу в 45° градусов между глазами).

[3] Добро пожаловать в сленг виртуального мира: «мастдай» (от англ. Must Die — «должен умереть»), общепринятое прозвище компании Microsoft, запущенное в оборот легкой рукой «линуксоидов» — сторонников юниксоподобных операционных систем. Читатель, не поддавайтесь на провокацию: работа с юниксоподобными операционными системами для рядового пользователя всегда оборачивается чем-то вроде эротического развлечения в гамаке, ластах, акваланге и стоя (аллюзия, навеянная известным анекдотом). Лучше уж «мастдай»: такой удобный, родной и понятный.

[4] Для тех, кого неприятно удивляет это слово: портирование — перенос данных, внесение чего-то куда-то.

Впервые опубликовано в журнале «Домашний компьютер».