Цифровой журнал «Компьютерра» 2012 № 13 (113) | страница 32
Я этот информационный поток перемалывал, разделяя на фракции: что-то — в мусорную корзину, что-то — на последующую углубленную проработку, что-то — просто откладывал до лучших времен. Натуральный алгоритм работы — почти дословно по Аллену.
На Маке аналога Website Watcher, как я уже отметил, не нашлось, поэтому я вынужденно перешел на агрегаторы RSS-потоков. Программ этого класса очень много, хотя до недавнего времени они поражали однообразием.
Благодаря энергичному развитию технологии Google Reader и ее универсальной поддержки во всех RSS-агрегаторах практически любая страница в интернете автоматически портировалась в программу, что превращало работу с информацией практически неотличимой от привычного алгоритма Website Watcher. Более того: там, где RSS-лента не форматировалась, на помощь приходил сервис page2rss.com, который превращал любой html-контент в RSS-канал.
Выше я сделал оговорку — «до недавнего времени». Не случайно: мои алгоритмы работы с информацией претерпели кардинальное переосмысление, что привело к очередному тупику. Из которого пока что я не вижу выхода, поскольку не знаю программ, способных соответствовать моим новым требованиям к сбору и обработке информации.
Поясню о чем идет речь — в надежде, что, может, кто из читателей что-то знает ценное и подскажет хотя бы направление, в котором следует искать. Главное изменение — отказ от этапа первичной переработки информационного шлака. Отказ вынужденный и продиктованный полным несоответствием старых алгоритмов моим текущим потребностям. Подозреваю, что дело не только во мне лично, а в объективных изменениях, таких как качественная интенсификация информационного потока и релятивизация информации.
Поясню, о чем речь. Технически моя работа раньше выглядела следующим образом: просматриваю полный поток новой информации, который отражается на RSS-ленте (или, как в Website Watcher, просто на порталах, которые я отслеживаю), и произвожу сортировку по вышеприведенному «алленовскому» алгоритму (в корзину, когда-нибудь, дальнейшее углублении темы).
В какой-то момент поймал себя на том, что перестал чисто физически справляться с нагрузкой. Информационный поток стал настолько интенсивен (вырос в разы!), что уже не только не хватает времени, но и руки опускаются, когда утром в RSS-агрегаторе красуются цифры 600, 400, 1380. Это количество обновившихся за день страниц на интересующих меня порталах!
И цифры эти совершенно нереальные! У меня просто нет времени перелопачивать этот ворох шлака, в котором, дай бог, найдется пяток-другой реально полезных и нужных мне информационных поводов.