Цифровой журнал «Компьютерра» 2012 № 25 (125) | страница 6
- IBM вкладывает серьёзные усилия в инструментарий, связанный с анализом и обработкой больших массивов данных (Big Data). Какие разработки сейчас представлены на рынке?
- Для наших партнёров колоссальное значение имеет возможность анализировать данные. Бизнес-аналитика имеет фундаментальную важность. И в будущем, помимо традиционных корпоративных данных, потребуется также анализ информации из социальных медиа. Сегодня всё чаще можно наблюдать, что компании анализируют данные из внешних социальных ресурсов, чтобы понять отношение к ним со стороны широкой публики.
Внутри компаний большое значение будет иметь анализ «социальных» данных для того, чтобы понять настроения работников и то, насколько эффективны производственные процессы. Таким образом, возможность сбора и анализа, в том числе предиктивного, больших объёмов данных и принятие решений на их основе имеют большое значение сегодня и будут иметь ещё большее в будущем.
- Сортирование большого объёма данных может представлять серьёзную проблему. Что делает IBM в этом направлении?
- Мы считаем наиболее продуктивным подходом расстановку тэгов для определённых наборов данных. Например, если вы размещаете какие-либо файлы в открытом доступе, вы можете оставить тэги специально для того, чтобы их потом было проще использовать — в рамках «социального» бизнеса или в социальных медиа.
Например, мне как-то довелось общаться с коллегой, который исследовал один очень специфический вопрос, связанный с банковской деятельностью. Он зашёл в наше внутреннее сообщество, посвящённое внутренней же работе по части social business, провёл поиск по конкретному тэгу и нашёл довольно большое количество файлов именно с теми данными, которые ему были нужны, и с контактной информацией людей, эти файлы разместивших. И далее он смог наладить с ними сотрудничество, хотя никогда прежде с ними не встречался.
(Игорь Бреус) — Из моего опыта: у нас есть довольно большое количество поисковых механизмов и единый интерфейс поиска для всех сотрудников. Он достаточно простой. Традиционно он разделён на две части. С одной стороны вы видите то, что предлагает вам поисковая машина, которая как-то проиндексировала информацию, и она пишет коэффициент релевантности того, что она нашла, вашему запросу — из каких-то «своих» соображений и анализа того, что вы делали до этого.
А на вторую половину экрана обычно выводятся результаты, уже просмотренные другими людьми и помеченные ими тем или иным образом. Я обычно начинаю просмотр именно с этой половины экрана. Почему? Потому что, если человек посмотрел эти данные, и как-то отметил, и ещё заполнил в сервисе закладки, это означает, что он считает, что это что-то важное.