Революция в аналитике. Как в эпоху Big Data улучшить ваш бизнес с помощью операционной аналитики Фрэнкс Билл

Таким образом, для того чтобы организация смогла осуществлять любой необходимый ей анализ данных любого типа и в любое время, она должна сначала установить на свое место опоры. Стоит проводить периодический (возможно, ежегодный) обзор базовых опор или вспомогательных технологий, которые организация еще не внедрила. Возможно, в ходе очередного обзора вы придете к выводу о необходимости разработки бизнес-кейса с целью добавления недостающего компонента в окружение. Если потребности организации в операционной аналитике понуждают к установке новой опоры, организации следует ее добавить, поскольку это увеличит гибкость и функциональность при построении аналитических процессов.

Конечных пользователей не должно волновать, где хранятся данные

Суть в том, что конечных пользователей, будь то профессиональные аналитики или пользователи традиционной бизнес-аналитики, менее всего волнует, где хранятся данные, потребные им для анализа. Пользователям нужен свободный доступ к данным и возможность создавать и реализовывать любые необходимые им аналитические процессы с максимальной легкостью и с достаточной производительностью{46}. Например, подборки сведений о клиентах, таких как демографические данные, представлены в виде таблиц в реляционном окружении или в виде файлов в нереляционном окружении? Пользователям это безразлично, были бы обеспечены доступ, свободное использование и производительность, желаемые пользователями.

Сосредоточьтесь на том, чего желают пользователи

Пользователям безразлично, где хранятся данные или на каких опорах выполняется аналитика. Им просто нужен доступ к любым данным для любого вида анализа в любое время. Чем меньше пользователи вынуждены думать о физических местах хранения и анализа данных, тем эффективнее они могут действовать.

Поставщики сейчас усиленно работают над тем, чтобы сделать несоизмеримые опоры единого аналитического окружения тесно интегрированными, если не практически прозрачными для пользователей. Они встраивают в них коннекторы, которые позволяют пользователям, работающим на одной платформе, получать свободный доступ к данным на другой платформе. Благодаря этому пользователи могут сосредоточиться на логике аналитического процесса, не беспокоясь о том, где физически находятся данные. На практике это означает, что работающий в реляционной среде пользователь может видеть данные в виде таблицы, тогда как на самом деле они хранятся в виде файла в нереляционной среде. Когда поступает запрос на эти данные, они извлекаются из нереляционного хранилища и передаются на реляционную платформу для обработки запроса. Пользователи не знают о происходящем, да им оно и не важно, пока поддерживается производительность. Если же производительность страдает, системные администраторы могут перенести данные из файла, хранящегося в нереляционном окружении, в реляционную таблицу, чтобы не требовалось осуществлять преобразование данных. И, наоборот, данные из реляционной таблицы могут быть перемещены в нереляционный файл, если общие требования к обработке обусловливают это место как лучшее для хранения данных. В общем, любую часть данных можно разместить на хранение туда, где они будут наиболее пригодны для использования.

При выборе решений для корпоративной аналитической среды важно оценивать как текущие возможности, так и долгосрочные планы поставщиков по добавлению продуктов к единому аналитическому окружению. С одной стороны, не нужно откладывать решение в ожидании следующего поколения продуктов с незначительной дополнительной функциональностью. С другой стороны, не стоит игнорировать долгосрочные дорожные карты продуктов, которые вы планируете приобрести. Технологии меняются быстро, и разные поставщики могут идти разными путями. Вы можете найти двух поставщиков с эквивалентными предложениями для удовлетворения ваших сегодняшних потребностей, но их дорожные карты могут существенно разниться, так что в перспективе один из них способен значительно превзойти другого.

Как насчет облака?

Читатели, безусловно, знакомы с концепцией облака и облачных архитектур, поэтому я не стану давать здесь базовых определений, а остановлюсь на нескольких ключевых моментах, важных в контексте нашего разговора об операционной аналитике. Меня часто спрашивают по поводу использования облака для аналитических процессов, как операционных, так и неоперационных. Чтобы ответить на этот вопрос, важно провести различие между облачными архитектурами и облачными услугами.

Организации могут внедрить облачную архитектуру на собственном оборудовании под защитой своих брандмауэров. Это частное облако позволит обеспечить эффективное совместное использование ресурсов без какого-либо внешнего вмешательства и потери контроля над данными. Другой вариант – аренда пространства на общедоступном облаке у внешнего поставщика облачных услуг. В этом случае организация платит поставщику только за используемые ею оборудование и ресурсы (включая маржу прибыли для поставщика).

Для малого бизнеса или исследователей, которые обычно используют лишь небольшую часть ресурсов сервера, общедоступное облако может быть очень выгодным вариантом, даже несмотря на надбавку к цене со стороны поставщика. У крупных же организаций, использующих большие данные и операционную аналитику, обычно так много пользователей, использующих так много данных, что общедоступное облако в конечном счете может обойтись им гораздо дороже, чем частное. Например, если организация использует вычислительную мощность 20 серверов практически беспрерывно, то аренда ресурсов обойдется ей намного дороже, чем владение собственными. Кроме того, использование общедоступного облака для уязвимых данных поднимает вопросы, связанные с безопасностью и соблюдением конфиденциальности. Эти вопросы могут носить правовой характер или же касаться восприятия: так, многие потребители могут чувствовать себя некомфортно, если компания будет хранить их персональные данные на общедоступном облаке.

Использовать облако или нет?

Частное облачное окружение – это чрезвычайно мощная и экономически эффективная архитектура, к которой прибегнут многие организации. Общедоступные облака могут оказаться дорогостоящими для крупных организаций, поэтому вряд ли будут широко использоваться для целей операционной аналитики, как это сегодня рекламируется на рынке. Все опоры и вспомогательные технологии, рассмотренные нами в этой главе, могут работать в облачной архитектуре.

Сегодня многие поставщики предлагают аналитику в виде сервисных пакетов на базе общедоступного облака. Эти приложения позволяют пользователям создавать и осуществлять аналитические процессы с помощью инструментов, которые предлагаются по подписке или на основе платы по мере пользования. Многие, но не все, аналитические сервисные продукты могут быть юридически закреплены за организацией и присоединены к частному облаку. Прежде чем тратить время на оценку конкретного аналитического метода в качестве сервисного продукта, убедитесь в том, что он подходит для вашего запланированного окружения. Например, если вашей организации не разрешено использовать общедоступные облака, вряд ли имеет смысл рассматривать продукты, доступные только там.

Частное и безопасное облачное окружение способно обеспечить гибкость, необходимую для превращения аналитики в операционную, а также хорошую рентабельность. Вместо того чтобы иметь на 15 отделов один сервер, который к тому же часто простаивает или недостаточно используется, можно иметь пять серверов, которые с лихвой удовлетворят потребности всех отделов. Это позволит снизить затраты на обслуживание и административные накладные расходы. В ближайшие несколько лет внутренние частные облачные архитектуры получат широкое распространение повсеместно и будут применяться для поддержки многих операционно-аналитических процессов.

Что же касается общедоступных облаков и аналитики в качестве предложений сервиса, то они в основном будут привлекать малый и средний бизнес, а также крупные организации для исследований на начальных этапах.

Подведем итоги

Наиболее важные положения этой главы:

• Превращение традиционной аналитики в операционную – это не технологическая проблема для большинства организаций. Проблемы с технологиями являются симптомами фундаментальных проблем с корпоративной политикой или культурой.

• Новые технологии, например Hadoop, не заменяют ранее существовавшие технологии, такие как реляционные базы данных, а дополняют их.

• Аналитическое окружение развивается, объединяя много платформ разной мощности, каждая их которых предназначена для решения разных задач.

• Не откладывайте решение об инвестициях в ожидании выхода новых продуктов с новыми функциями, если только эти функции не имеют для вас крайне важного значения.

• Компьютинг на основе текстуры ведет к созданию единого аналитического окружения, которое включает множество взаимосвязанных, масштабируемых и интегрированных компонентов.

• Современное единое аналитическое окружение покоится на трех основных опорах и ряде вспомогательных технологий. Цель его – позволить осуществлять любой тип анализа с использованием любых данных любого типа и объема в любое время.

• Реляционная опора является основой для развертывания операционной аналитики и обеспечивает масштабируемость по всем ключевым для организации параметрам.

• Опора для обнаружения данных предназначена для исследования всех видов данных при помощи любых аналитических методов и призвана быстро обеспечивать нахождение новых инсайтов, а не максимальную скорость обработки.

• Нереляционная опора (как правило, Hadoop) превосходно подходит для работы с нетрадиционными форматами данных, для хранения малоценных и редко используемых данных, а также для целей архивирования.

• Вспомогательные технологии, позволяющие применять специфические типы обработки, включают технологии аналитики в памяти, технологии на основе графических процессоров, встроенные аналитические библиотеки и технологии обработки сложных событий.

• Пользователи не желают знать, где физически находятся данные или что именно их обрабатывает. Единое аналитическое окружение развивается, так что пользователям не придется больше беспокоиться насчет этих вопросов.

• Облачные архитектуры могут быть использованы в едином аналитическом окружении. Для большинства крупных организаций частные облака будут предпочтительнее публичных.

Глава 6

Управление и конфиденциальность

Подобно тому как правительство может подавлять граждан чрезмерно ревностным принятием и применением законов, так и организация может подавлять своих сотрудников чрезмерным упором на управление. В то же время отсутствие правил обычно ведет к анархии и хаосу, что не лучше угнетающих правил. Управление становится тяжким бременем только тогда, когда организация сама делает его таковым.

Лично мне, как и многим, не нравится слово «управление», но реальность такова, что у нас нет более подходящего термина для наименования того, что нам необходимо обсудить в этой главе. Многие читатели могут даже засомневаться, стоит ли им вообще читать ее. Ведь управление – это сухая, скучная и преходящая тема, верно? Необязательно так. Большинство людей согласятся с тем, что операционная аналитика требует текущего контроля качества и гарантии надежности. Кроме того, должны существовать правила, прописывающие место для осуществления обработки в едином аналитическом окружении, устанавливающие протоколы безопасности и направляющие политику конфиденциальности. Все эти темы подпадают под категорию «управление».

Эта глава посвящена тому, как правильно управлять единым аналитическим окружением, чтобы обеспечить пользователей и приложения доступом и ресурсами, необходимыми для успешного превращения традиционной аналитики в операционную. Мы поговорим о том, чем принципы управления, затрагивающие анализ больших данных и операционную аналитику, отличаются от традиционных подходов. Также сделаем некоторые выводы касательно конфиденциальности, поскольку ее защита должна быть ключевым компонентом любого плана управления.

Закладываем основу управления

Давайте начнем с обсуждения того, почему управление может быть непопулярной темой, а затем представим основные концепции, которые следует применять при создании структуры управления операционной аналитикой. Также необходимо отметить, что характер взаимодействий и отношений между сотрудниками может играть такую же важную роль, как и формальные правила.

Урок от «1984»

Недавно я перечитал роман Джорджа Оруэлла «1984»{47}. Одна из увлекательных нитей повествования связана с новоязом – официальным языком тоталитарного общества. Правительство Большого Брата намеренно «развивало» язык таким образом, чтобы максимально сократить в нем количество слов. Это делалось с целью усиления контроля над людьми. Предполагалось, что, если удалить из языка слова, позволяющие людям формировать новые мысли, у людей не будет возникать новых мыслей. Правительство Большого Брата планировало довести развитие новояза до такой степени, чтобы люди полностью лишились способности формировать новые, а также нежелательные мысли, опасные для тоталитарного режима.

В некоторых отношениях производственное окружение в крупной организации очень даже может походить на новояз. Если аналитическое окружение чрезмерно регламентировано, это ограничивает способность пользователей задавать новые вопросы о содержащейся в нем информации и распознавать новые инсайты. Разница лишь в том, что в «1984» правительство Большого Брата намеренно стремилось лишить людей способности формировать новые мысли, тогда как в бизнес-организациях никто, как правило, не стремится умышленно ограничивать способность людей задавать новые вопросы. Однако корпоративная политика иногда приводит как раз к этому эффекту. Нижеследующие примеры объясняют, почему тема управления так непопулярна среди пользователей. Многие из них никогда не сталкивались с поддерживающим и дружественным управлением в аналитических окружениях, поэтому когда речь идет об управлении, сразу вспоминают об ограничивающих и обременительных правилах.

Модель допуска

Главное препятствие при управлении, с которым сталкиваются многие пользователи, связано с правилами разграничения доступа к данным. Правила безопасности в отношении данных могут оказывать гораздо большее влияние на способность обнаруживать новые инсайты, чем любые другие факторы. В конце концов, если данные недоступны, они не могут быть проанализированы. К счастью, существует возможность создать такую систему безопасности, которая позволяет создавать операционную аналитику без ущерба для безопасности данных. Но создание такой системы требует некоторого изменения мышления.

Мне нравится проводить параллель между протоколами безопасности в аналитическом окружении и многообразными уровнями допуска в правительстве. Есть информация, которую может увидеть практически каждый, но есть и сверхсекретная информация, доступ к которой имеет очень ограниченный круг лиц. Уровень доступа зависит от занимаемой должности и степени доверия, заработанного человеком с течением времени. Аналогичный подход может быть применен и в аналитическом окружении.

Члены аналитической команды, отвечающие за поиск новых инсайтов и изучение инновационных аналитических процессов, должны пользоваться высоким уровнем доверия у организации. Они должны иметь доступ к более широкому спектру данных, чем основная масса сотрудников, и возможность комбинировать этими данными более широким спектром способов. Другими словами, должны иметь высший уровень допуска. В частности, в процессе поиска данных им следует позволить использовать данные такими способами, которые могут быть неприемлемы в операционном или производственном окружении. Например, они могут комбинировать уязвимые данные о клиентах из разных частей организации. Это не означает, что им должно быть позволено нарушать корпоративные правила и процедуры, когда настанет время переводить процесс из поискового режима в операционное окружение. Это означает, что они нуждаются прежде всего в гибкости, чтобы находить нечто, достойное перевода в операционный режим.

Подчеркиваю: нужно следить за тем, чтобы при смягчении корпоративных правил строго соблюдались все действующие законы. Например, существуют юридические ограничения на обращение с данными медицинских и кредитных карт. Обеспечьте пространство для маневра в рамках корпоративной политики, но не уполномочивайте своих сотрудников на нарушение законов. Кроме того, как мы увидим далее, касаясь конфиденциальности, важно позаботиться о том, чтобы не создавать аналитику, заставляющую ваших клиентов чувствовать себя некомфортно, вне зависимости от того, насколько она легальна.

После того как ценный процесс обнаружен, пользующиеся доверием специалисты-аналитики могут вернуться к работе в рамках стандартного режима безопасности, чтобы реализовать процесс в приемлемой для операционного применения форме. Однако если они будут изначально работать в условиях жестких ограничений, это существенно затруднит или даже сделает невозможным открытие новых эффективных инсайтов для нужд организации.

Установите категории допуска

Организации могут последовать примеру правительства и внедрить систему разноуровневого допуска. Доверенные лица, занимающиеся обнаружением данных, должны иметь максимальную свободу действий, чтобы способствовать инсайтам, включая комбинирование данных способами, обычно не дозволяемыми в организации.

Работа в едином окружении, которое включает как поиск, так и размещение данных, существенно облегчает переход от одного режима к другому. Вот почему так важно создание единого аналитического окружения, о чем мы говорили в пятой главе. В этом случае сотрудники, даже если они имеют больше свободы в рамках поискового окружения, будут понимать и учитывать ограничения в производственном окружении. Если поисковое и производственное окружения совместимы, то перенос данных из поиска в производство будет происходить гораздо проще, чем при значительной разнице между окружениями. Когда специалисты-аналитики знают об ограничениях, существующих в производственном окружении, они могут с самого начала действовать одним из двух способов: либо проявить гибкость при планировании, либо определить, какие правила должны быть изменены. В обоих случаях все будет соответствовать существующим правилам.

Еще один хороший подход можно позаимствовать у домашних систем безопасности. Они могут иметь детекторы движения, датчики сохранности стекол, видеокамеры и т. п. При организации большой вечеринки вы отключаете систему. Поскольку люди придут к вам в дом на законных основаниях, строгий контроль не нужен. Но, когда гости уходят, вам не составит труда снова включить охранную систему. Аналогичный подход можно использовать и в поисковом окружении. Речь идет не о том, чтобы отказаться от правил безопасности как таковых, а о том, чтобы намеренно отключать некоторые защитные функции для доверенных лиц в установленное время.

Требуется сотрудничество

К сожалению, во многих организациях аналитический отдел и ИТ-отдел находятся в состоянии постоянных распрей. Я много раз сталкивался с ситуациями, когда отношения между ними были далеко не дружественными. Но если организация собирается превратить традиционную аналитику в операционную, абсолютно необходимо решить данную проблему. Когда мы вместе с клиентом пытаемся ее устранить, сотрудники моей компании называют это «консультированием по проблемам брака». Как правило, мы сажаем с одной стороны стола ИТ-команду, а с другой стороны – аналитическую команду. Поначалу все сидят с угрюмыми лицами и скрещенными на груди руками. На предварительных встречах каждая команда изливает на нас поток жалоб на то, насколько неразумна другая команда и как трудно с ней работать. Причем для конфликтных отношений существуют вполне объективные причины.

Если вы потрудитесь заглянуть в должностные инструкции этих сотрудников, то увидите, что каждый из них просто выполняет свои обязанности, из-за чего и происходят конфликты. IT-команда отвечает за стабильную и без сбоев работу своих систем, а также за то, чтобы пользователи находились под контролем и не выходили за установленные рамки. Аналитическая команда отвечает за создание инновационных ресурсоемких процессов и за корректировку правил, если это нужно для обнаружения новых инсайтов. Для того чтобы превратить традиционную аналитику в операционную, необходимо, чтобы команды работали совместно, а припарками конфликт не излечишь.

Может потребоваться и принуждение к сотрудничеству

ИТ-команда и аналитическая команда должны работать в организации совместно, чтобы успешно превратить традиционную аналитику в операционную. В идеале команды должны сотрудничать добровольно. Если же этого не происходит, высшее руководство должно обязать их сотрудничать в приказном порядке. Принудительное сотрудничество лучше, чем отсутствие всякого сотрудничества.

Операционная аналитика, разработанная аналитической командой, должна встраиваться в операционно-производственные системы, поэтому специалисты-аналитики не могут продолжать работать по старинке – вытаскивая данные в автономное аналитическое окружение. Это означает, что аналитическая команда не сможет выполнить операционную аналитику без участия и поддержки ИТ-команды. С другой стороны, ИТ-команда не может сама разрабатывать аналитические процессы, поскольку это не ее область знаний. Ей необходима помощь аналитической команды для построения и осуществления процессов. Кроме того, запросы на аналитику от бизнес-партнеров достаточно важны для того, чтобы ИТ-команда и аналитики могли их игнорировать. Для успешного выполнения операционной аналитики придется заставить «айтишников» и аналитиков пойти на сотрудничество. Также заметьте, что конфликт может возникать даже в тех случаях, когда аналитики являются частью ИТ-команды.

К счастью, благодаря тому, что сегодня аналитическая функциональность интегрируется с операционными системами и встраивается в них, стало возможным наладить тесное сотрудничество между аналитиками и ИТ-командой путем корректировки традиционных принципов управления с учетом сегодняшних технологий и требований. На рис. 6.1 представлены некоторые идеи насчет того, как к этому приступить.

Если ваша организация еще этого не сделала, ей придется принудить команды сотрудничать в приказном порядке. Поначалу им будет трудно, но со временем они научатся работать вместе. Такое случается и в жизни, когда вы знакомитесь с кем-то, кто поначалу вам не нравится. Но весьма часто по прошествии некоторого времени вы лучше узнаёте этого человека и понимаете, что он вовсе не такой уж и неприятный. Возможно, вы не будете проводить с ним отпуск каждый год, но зато будете спокойно с ним общаться, когда потребуется. Вот этого минимума и должны достичь «айтишники» с аналитиками. Совместная работа не покажется скверной, когда обе команды будут ей привержены и узнают, что могут предложить им партнеры.

Управление Интернетом вещей

Об Интернете вещей мы с вами говорили во второй главе. В подавляющем большинстве те невообразимые объемы данных, которые он генерирует, являются абсолютно бесполезными. Проиллюстрируем это на примере. Через несколько лет появится много умных домов с умными кухнями. Там датчики будут повсюду: в холодильнике, на полках в кладовке и даже на отдельной таре. Бутылка кетчупа в холодильнике сможет сообщать о своем состоянии программе инвентаризации продуктов питания, в чью задачу входит составление списков необходимых покупок. Так, посредством своих датчиков бутылка сообщит, что ее емкость заполнена наполовину, что на протяжении всего времени кетчуп хранился при правильной температуре и что срок его годности заканчивается через три месяца. Это значит, что пока новый кетчуп покупать не нужно. То же самое делают сотни других продуктов питания на вашей кухне, создавая множество данных.

Информация, поступающая от продуктов, является ценной для централизованной программы инвентаризации и генератора списка покупок. Однако в долгосрочном плане эти данные не имеют никакой ценности. Единственное, что нам нужно, – это список необходимых покупок перед посещением магазина. Нам совершенно неинтересны детали коммуникации между вещами на кухне, в результате чего был составлен список{48}. За исключением этих данных здесь не происходит ничего такого, что бы отличалось от наших повседневных дел. Разве семейные пары запоминают в мельчайших подробностях, как они составляли список покупок перед походом в магазин? Нет. Они запоминают только то, что им действительно важно, – окончательно составленный список покупок.

Игнорируйте безумолчную болтовню

Интернет вещей будет создавать невообразимые объемы данных. Однако большая их часть лишена смысла за пределами текущего момента. Точно так же как вы запоминаете только несколько важных обменов данными в повседневных разговорах, так нет и необходимости сохранять подавляющее большинство коммуникаций между вещами.

Наш мозг превосходно умеет отфильтровывать ненужную информацию. Мы можем хранить яркие воспоминания о важных событиях, произошедших много лет назад, и с трудом вспоминать малозначимые разговоры, состоявшиеся только вчера. Это происходит потому, что мы, эффективно сортируя информацию, запоминаем наиболее значимую для нас. Аналогичный подход нужно применять и к данным от Интернета вещей. Хотя в совокупности генерируемые им объемы данных колоссальны, но каждый датчик по отдельности генерирует не так уж и много информации. Коммуникация датчиков состоит из передачи очень маленьких и легко управляемых пакетов информации. Ни один датчик сам по себе не представляет проблемы с точки зрения объема данных. Проблемы возникают, когда речь идет о совокупности датчиков и их коммуникации. Например, авиакомпания может отслеживать показания только определенных ключевых датчиков во время полета самолета, поскольку отслеживать показания всех датчиков в режиме реального времени окажется невозможным или ненужным.

Еще одно последствие развития Интернета вещей состоит в необходимости введения глобальных стандартов и принципов управления в отношении генерации и использования данных. Например, все приборы и вещи в вашем доме должны использовать один и тот же протокол. Но, если ваши соседи используют другие бренды с другими протоколами, это не создаст проблемы. Однако в других случаях использование разных протоколов является непозволительным. Например, если каждый бренд беспилотного автомобиля будет использовать свой патентованный метод передачи и сбора данных, то аварии станут неизбежными, поскольку автомобили не смогут эффективно взаимодействовать друг с другом. Кроме того, большое значение имеет принятие правовых и этических стандартов в отношении использования данных. Например, каким образом и кто будет отслеживать и анализировать водительскую историю владельцев автомобилей?

Для того чтобы беспилотные автомобили стали реальностью, все они должны использовать одинаковые стандарты. Каждый автомобиль должен быть в состоянии правильно отправлять и получать информацию о скорости, местоположении и намерении изменить траекторию движения. Разумеется, введение глобальных стандартов поначалу вызовет затруднения, но они необходимы и в долгосрочной перспективе окупят себя. К счастью, в настоящее время уже ведется разработка таких стандартов. В частности, компании, заинтересованные в развитии Интернета вещей, начали внедрять стандарты управления. От введения стандартов выиграет каждая организация, которая планирует использовать данные, поставляемые Интернетом вещей, для целей операционной аналитики.

Определите, где потребуется аналитика

Нередко проблема с управлением возникает при определении того, в какой части единого аналитического окружения следует выполнять каждый этап аналитического процесса. В конце концов ключевая задача управления – установить стандарты по использованию существующих активов. Между тем на вопрос, где должна осуществляться та или иная обработка, ответить непросто, поскольку это зависит от множества факторов. Они в значительной степени пересекаются с теми факторами, которые следует рассматривать при создании бизнес-кейса, о чем мы подробно говорили в четвертой главе. Это имеет смысл, поскольку решение о том, где и какую часть процесса следует реализовывать, должно быть основано на такой же объективной оценке различных вариантов с точки зрения затрат и доходов. Вы должны ответить на следующие вопросы:

• Какой из компонентов окружения может справиться с обработкой?

• Какие инструменты обладают необходимой функциональностью?

• Какими навыками, имеющимися и доступными, обладает команда?

• Где в настоящее время хранятся необходимые данные?

• Существуют ли какие-либо уже известные процессы, у которых можно позаимствовать код?

• Цель заключается в поиске нового инсайта или применении уже имеющегося?

• Какие вам требуются аналитические методы?

Все эти и многие другие факторы помогут определять, где лучше всего реализовать данный процесс или его часть. Но потребуются и усилия, чтобы выяснить, как наилучшим образом выполнить процесс в рамках сложного единого аналитического окружения. Давайте рассмотрим несколько соображений, которые при этом стоит иметь в виду.

Никогда не говорите, что это невозможно!

Один из уроков, которые я выучил за годы работы, состоит в том, что, если у вас есть опытный пользователь любых аналитических инструмента или технологии, значит, есть шансы, что, потратив достаточно времени и сил, он сможет выстроить практически все что угодно. В прошлом лично я разрабатывал аналитические процессы неидеальным образом. Знал только, что при помощи хорошо знакомых мне инструментов могу уложиться в сроки. При этом существовали куда более оптимальные способы реализации процессов. С традиционной пакетной аналитикой подобное обычно сходит с рук. Однако для операционной аналитики с ее степенью зависимости от фактора времени и с ее требованиями к масштабированию такой подход – когда для разработки решения выбираются не оптимальные, а хорошо знакомые подручные инструменты – вряд ли будет успешным.

Если вы спросите у первоклассного программиста, использующего язык SQL, сможет ли он выполнить предложенный ему набор логических задач, в большинстве случаев он ответит: «Да». Если вы спросите у специалистов по SAS или R, смогут ли они выстроить требуемую логику, они также ответят: «Да». Если вы спросите у программистов, специализирующихся на Python или Java, смогут ли они выстроить эту логику на Hadoop, они тоже ответят: «Да». Вот что вам нужно понять: все опытные специалисты смогут реализовать требуемую вам аналитическую логику. Проблема в том, что есть более или менее эффективные способы.

Никогда не говорите специалисту, что данный аналитический процесс не может быть реализован в предпочитаемом им компоненте единого аналитического окружения при помощи предпочитаемого им набора инструментов. Заявлять сразу: «Не сможете!» – значит обострять отношения. Когда вы говорите специалисту: «Это невозможно сделать в том окружении и теми инструментами, которые вы предпочитаете», его немедленной реакцией будет: «Возможно!» И он действительно сделает все возможное, чтобы доказать вашу неправоту. Но такой подход контрпродуктивен.

Не обостряйте отношения без необходимости

Специалисты-аналитики бывают очень упрямыми. Если скажешь, что некая задача им не по силам, они первым делом постараются доказать вашу неправоту, вместо того чтобы тут же решить проблему. Но такой подход контрпродуктивен. Лучше признайте, что каждый волен поступать как хочет, а затем предложите команде найти лучший способ решения данной проблемы.

Лучше использовать более продуманный подход к этой проблеме и рассмотреть ее под разными углами. Переключите внимание каждого специалиста на поиск наилучшего способа построения процесса. Какие технологии позволят с максимальной эффективностью реализовать аналитический процесс и развернуть его в операционном масштабе? Когда задача формулируется таким, менее грозным, образом, специалисты, как правило, с большей готовностью признют недостатки в предпочитаемых ими подходах. Например, при одном подходе процесс программирования может растянуться надолго, тогда как при другом подходе сложно масштабировать.

Попросите каждого специалиста оценить совокупные трудозатраты на реализацию процесса тем способом, который он предпочитает. Затем команда может сравнить результаты и принять обоснованное решние. В едином аналитическом окружении гораздо проще, чем в традиционном, переместить обработку из одного компонента в другой для достижения максимальной производительности. Все, что нужно, так это реализовать сжатую версию создания бизнес-кейса.

Выберите то, что работает лучше всего

Предыдущий раздел оставляет без решения открытую проблему, а именно изначальную неопределенность насчет того, какой из вариантов эффективнее другого. Возможно, сработают несколько вариантов. Несколько лет назад на одной конференции одновременно обсуждались два подхода к анализу социальных сетей. В конференц-зале № 1 проходила презентация проекта по реализации анализа социальных сетей в реляционном окружении. В конференц-зале № 2 обсуждались возможности анализа социальных сетей в нереляционном окружении. Я присутствовал во втором конференц-зале и обнаружил, что большая часть обсуждения была сосредоточена не на аналитике или ценностях, создаваемых ею, а на утверждении о том, что анализ социальных сетей не может быть выполнен в реляционном окружении. Парадоксально, но в конференц-зале № 1 в это время говорили о том, как наладить такой анализ в реляционном окружении и почему оно является единственно пригодным для этого местом.

Эти дискуссии доказали, что существуют по крайней мере два способа анализа социальных сетей. Но, если копнуть глубже и посмотреть, сколько времени и сил требует написание программ для того и другого вида анализа, мы увидим различия. Скорее всего, увидим различия и в производительности процессов. Вполне естественным было для выступающих в каждом из конференц-залов описывать преимущества своего подхода. Однако им следовало бы воздержаться от заявлений о том, что предлагаемый ими способ является единственно возможным для данного вида анализа. Ведь они ничего не доказали, поскольку в соседнем помещении в это время как раз обсуждался альтернативный подход.

Сосредоточьтесь на оптимальных комбинациях

Для того чтобы максимизировать эффективность и отдачу от аналитики, необходимо обеспечить, чтобы каждый компонент единого аналитического окружения – и каждый член аналитической команды – делал то, что он может делать лучше всего. Потратьте время на поиск компромиссного соотношения требуемых навыков, вычислительных мощностей и аналитических методов. Для создания оптимального процесса может понадобиться не один, а несколько компонентов единого аналитического окружения. Если это звучит как прописная истина, пусть будет так. Тот же принцип применим и ко многим другим ситуациям.

Для иллюстрации рассмотрим пример с незастроенным земельным участком. Если вы обратитесь к девелоперу, строящему дома на одну семью, то он предложит вам оптимальный план постройки именно такого дома. Если обратитесь к девелоперу, который специализируется на кондоминиумах, таунхаусах или апартаментах, он предложит вам оптимальный способ максимизировать стоимость земли за счет указанных структур. Наконец, если обратитесь к девелоперу, работающему с коммерческой недвижимостью, он предложит вам оптимальный способ постройки торгового центра, медицинского комплекса или бизнес-парка. Важно, что каждый девелопер окажется прав в рамках своей компетенции. Это очень похоже на то, как в группе специалистов-аналитиков каждый предложит оптимальный способ построения аналитического процесса с использованием только предпочитаемого им компонента аналитического окружения и с помощью предпочитаемых им аналитических инструментов.

Оптимизируйте целое, а не части

Вы должны поставить цель оптимизировать эффективность аналитического процесса в целом за счет наилучшего использования компонентов единого аналитического окружения. Попытки оптимизировать процесс в рамках одного компонента могут привести к гораздо менее эффективным решениям, чем многокомпонентный подход.

Что должен сделать владелец участка, так это найти наилучшее использование земли в целом. План застройки вполне может представлять собой комбинацию нескольких домов на одну семью, одного-двух небольших многоквартирных дома и также небольшого торгового центра. Владельцу же участка следует увидеть картину целиком, под разными углами. Ему нужно проконсультироваться с разными экспертами и найти наилучшую комбинацию подходов для удовлетворения своих потребностей. Окончательный вариант может сочетать компоненты рекомендаций каждого эксперта. Такой же подход следует применять и к аналитическим процессам. Необходимое условие для этого – наличие людей, которые способны охватить картину целиком и найти компромиссное соотношение компонентов.

Управление операционной аналитикой

Отчасти по причине непопулярности этой темы организации часто думают об управлении в последнюю очередь, когда вступают в эпоху Аналитики 3.0, о которой мы говорили в первой главе, и начинают превращать традиционную аналитику в операционную. Только после того как произойдут серьезные отключения, многие компании начинают задумываться об управлении операционной аналитикой. Разработка встроенной, автоматизированной и высокомасштабированной операционной аналитики и текущее управление ею требуют других подходов к управлению в отличие от тех, что традиционно применялись к аналитическим процессам. При пакетной аналитике ошибка влияет только на обработку одного пакета, и у специалистов, как правило, есть достаточно времени, чтобы выявить и устранить эту ошибку до следующего сеанса пакетной обработки. В случае операционной аналитики ошибка будет быстро распространяться, пока не будет устранена.

Итак, мы рассмотрели некоторые соображения, которые следует принимать во внимание при внедрении операционно-аналитических процессов. Теперь давайте рассмотрим пару сценариев из реальной жизни, наглядно иллюстрирующих необходимость компромиссного соотношения различных компонентов единого аналитического окружения для достижения эффективности.

Разнообразные требования

С точки зрения управления реальную проблему для операционной аналитики представляет наличие двух разных и даже противоречащих друг другу наборов требований, которые должны быть удовлетворены. Первый набор относится к процессу обнаружения данных, когда организация пытается найти новые инсайты и определить аналитические процессы, способные оказать наибольшее влияние. В этом случае требуются максимальная гибкость и минимальные ограничения. Второй набор требований относится к развертыванию процесса на операционном уровне. В этом случае главным приоритетом становится обеспечение высокой скорости, надежности и стабильности. Эти два набора требований приведены в табл. 6.1. Хотя они существуют сами по себе и даже, кажется, противоречат друг другу, но оба вполне выполнимы в рамках соответственно конфигурированного аналитического окружения.

После того как операционно-аналитический процесс разработан и внедрен, он должен управляться иным образом, нежели традиционные аналитические процессы. Одно из отличий заключается в управлении результатами каждого процесса. Операционная аналитика должна выполняться достаточно эффективно и быстро для того, чтобы удовлетворять операционным требованиям. Целью является улучшение, необязательно до совершенства, миллионов и миллионов ежедневно принимаемых решений. Если существует возможность дополнительно улучшить этот процесс, это замечательно, но только не за счет требуемых скорости и масштаба. Поначалу вам может быть некомфортно от мысли о том, что вы сознательно не реализуете всех предлагаемых аналитикой возможностей, но это вполне нормально, если наглядная отдача от аналитики, проистекающая из улучшения решений, превышает затраты на нее. При наихудшем сценарии, возможно, придется отказаться от использования на практике ценного открытия, если затраты на его операционализацию будут намного превышать ожидаемую отдачу.

Другое отличие операционной аналитики состоит в том, что принимемые решения должны постоянно контролироваться, чтобы отслеживать, как выполняется процесс. При операционной аналитике решения проверяются после того, как они были реализованы; при традиционной решения должны утверждаться до своей реализации. Поскольку решения в операционной аналитике принимаются автоматически, то при возникновении подозрений на ошибки придется проверить, скажем, последние 10 000 принятых решений. А при обнаружении аномалии может потребоваться остановить аналитический процесс и заняться расследованием.

Приготовьтесь чертыхаться

Точно так же, как с производственных линий иногда сходят дефектные продукты, так и операционно-аналитические процессы иногда генерируют дефектные решения. Порой проблема может быть настолько серьезной, что потребуется остановить процесс и «отремонтировать» его. Если частота ошибок достаточно низкая, это следует рассматривать как приемлемые издержки ведения бизнеса. Принять этот факт может оказаться достаточно затруднительным, зачастую приходится вносить изменения в корпоративную культуру.

В свете вышеуказанных различий организация должна быть готова к тому, что иногда операционно-аналитические процессы будут давать сбои. Возьмите такой крайний случай, как «мгновенный обвал» фондового рынка 6 мая 2010 г., о котором мы говорили в третьей главе{49}. Все началось с небольшой ошибки в одном торговом алгоритме. Многие другие алгоритмы раскрутили его действие и, подобно леммингам, разом бросающимся со скалы, устроили огромную заваруху. В автоматических процессах всегда будут возникать сбои, поэтому здесь действия проверяются после их реализации, а не рекомендации выдаются перед совершением действий.

Поначалу с этим трудно будет смириться, и вы можете столкнуться с сопротивлением на уровне корпоративной культуры. Однако если организация ответственно подходит к созданию, тестированию и мониторингу операционно-аналитических процессов, проблемы будут выявляться до того, как они причинят весомый ущерб. Здесь стоит подчеркнуть следующий важный момент: процесс обнаружения данных должен вестись на постоянной основе. С течением времени во всякий аналитический процесс следует вносить необходимые корректировки с учетом новых данных, новых реалий бизнеса или других значимых изменений.

Периодически возникающие проблемы – это неотъемлемые издержки ведения бизнеса. Организация должна спокойно к ним относиться и устранять их в рабочем порядке. Даже «мгновенный обвал» не обанкротил всех трейдеров, использующих автоматические торговые программы. На обычных производственных линиях также время от времени производятся бракованные изделия, разбиваются бутылки и подгорают продукты питания. Это нормальные производственные издержки. Если частота ошибок достаточно низкая, а средний уровень качества остается высоким, производитель будет процветать в долгосрочной перспективе благодаря достигнутому масштабу производства. То же самое верно и в случае операционной аналитики.

Или возьмите подходы, которые используются банками для выявления случаев мошенничества с кредитными картами или используются поставщиками услуг электронной почты для фильтрации спама. Ни одна из этих процедур не работает идеально. Мы по-прежнему получаем спам по электронной почте или можем стать жертвами мошенничества с банковскими картами. Иногда случается, что в папку со спамом отправляются нормальные письма или банк ошибочно блокирует кредитную карту. Тем не менее в целом ситуация намного лучше той, что была бы в отсутствие аналитики.

Организации не должны позволять своим сотрудникам фокусироваться на таких исключениях и пытаться обесценить подход целиком только лишь потому, что в одном-двух случаях аналитический процесс выдал неправильное или неоптимальное решение. Вопрос должен состоять в том, позволяет ли аналитика снизить, например, общий уровень мошенничества, поскольку никакой аналитический процесс не может исключить его полностью. Неизбежно проскальзывающие ошибки не должны затмевать собой весомых преимуществ операционно-аналитических процессов.

Когда сотрудники обнаруживают ошибочные решения, организация должна отстаивать процесс в целом и помочь сотрудникам понять, что определенная доля ошибок неизбежна. Работники на производственных линиях регулярно отбраковывают продукты, которые не соответствуют стандартам качества, но при этом не ставят под сомнение необходимость самой производственной линии. Точно так же операционная аналитика иногда будет генерировать плохие решения, однако это не должно восприниматься как повод ставить под сомнение необходимость процесса в целом.

Мониторинг операционной аналитики

Хотя операционная аналитика встроена в бизнес-процессы, сотрудники все равно должны активно отслеживать результаты принимаемых решений. Как никогда важное значение приобретает предоставление отчетов, сводной статистики, информации с панелей мониторинга и зрительных образов, позволяющих всем заинтересованным лицам в организации отслеживать эффективность операционной аналитики на постоянной основе. Причем, как то было принято и в традиционной аналитике, уровень детализации или агрегирования данных должен зависеть от уровня и роли заинтересованного лица. Это означает, что классические принципы бизнес-аналитики во многом применимы и к операционной аналитике, о чем мы подробнее поговорим дальше.

Как и в случае традиционной аналитики, в отношении операционной должны быть введены четкие правила, прописывающие последующие действия. Кто должен быть извещен и имеет право остановить процесс при обнаружении аномалии? Кто несет ответственность за мониторинг аналитических процессов, за их корректировку и обновление? Какова приемлемая частота ошибок? Какие еще показатели должны отслеживаться помимо частоты ошибок? Контекст операционной аналитики требует решения точно такого же комплекса вопросов, как и любой другой операционный контекст.

Давайте рассмотрим пример с промышленным предприятием, где операционная аналитика активно используется для регулировки оборудования на сборочной линии. Директор завода должен иметь доступ к детальной информации по регулировкам, произведенным на каждой единице оборудования. Он также должен иметь доступ к последним сенсорным данным и к информации о том, работает ли каждый станок согласно спецификации. Региональному же директору может быть достаточно подтверждения того, что в целом все заводы в регионе работают нормально. Наконец, генеральному директору компании нужна только сводная отчетность с указанием основных тенденций по регионам.

Многие старые правила применимы по-прежнему

Важная часть операционной аналитики – текущий контроль за правильностью и эффективностью миллионов решений, принимаемых в автоматическом режиме. При этом сами данные и метрики, которые хотят видеть люди, остаются фактическими теми же, что и в прошлом. Меняется только способ принятия решений, которые ведут к генерации тех же данных и метрик.

Суть в том, что традиционные правила фильтрации, агрегирования данных и составления по ним сводной отчетности для различных заинтересованных лиц полностью применимы и к операционной аналитике. Более того, во многих случаях существующая стандартная отчетность может не потребовать никаких изменений, поскольку сами данные и метрики, которые нужно видеть сотрудникам, остаются прежними. Меняется только метод принятия решений, ведущих к генерации данных и метрик. Несмотря на то что принятие решений отныне осуществляет автоматический процесс, сам характер решений и их цель могут оставаться такими же, что и в прошлом. Например, операционно-аналитический процесс, предлагающий оптимальные решения для сотрудников колл-центров, делает то же самое, что раньше сотрудники делали сами. Успешность решений с точки зрения содействия дополнительным продажам может отслеживаться традиционным способом, поскольку прежней осталась суть решений – делать предложения, вызывающие или не вызывающие отклик.

Физическая платформа и логическое окружение

Однажды ко мне обратился клиент, который осуществил очень успешный проект по обнаружению данных. (Проект был конфиденциальным, поэтому я не могу назвать имя клиента.) Он нашел ряд ценных инсайтов и захотел применить их на практике и внедрить в операционные процессы. Однако возникла проблема. Корпоративная политика компании, где он работал, предписывала, что любой компонент инфраструктуры, ставший частью даже одного технологического процесса, должен полностью соответствовать всей технологической политике. Другими словами, если бы мой клиент использовал платформу для обнаружения данных в составе любого технологического процесса, то он лишился бы той гибкости, которая необходима для обнаружения дополнительных инсайтов. К сожалению, одну из частей нового процесса имело смысл реализовать только на поисковой платформе. Клиент спросил у меня, как можно решить эту проблему.

Мы начали с изучения того, можно ли закодировать завершающий процесс иначе, чтобы выполнить его на технологической платформе. Часто такое можно сделать после того, как определена точная логика процесса. В данном случае это было невозможно, поскольку на поисковой платформе использовался собственный алгоритм, недоступный для использования где-либо еще, а дублировать его на других платформах оказалось бы слишком накладно. Клиент также справедливо заметил, что даже если бы удалось придать необходимую функциональность технологической платформе на сей раз, то в дальнейшем обязательно возникнут ситуации, когда сделать это будет невозможно. Таким образом, нам предстояло найти более универсальный подход к решению проблемы.

Ключом к решению стало признание различия между физической платформой для обнаружения данных и логическим окружением для обнаружения данных. При этом платформе для поиска инсайта отнюдь не нужно быть одновременно платформой, используемой в технологическом процессе. Мы решили, что самым быстрым и дешевым решением будет создать уменьшенную копию поисковой платформы в технологическом окружении. Единственной задачей новой платформы должна была стать поддержка операционно-аналитических процессов в технологическом окружении. Это решение позволило сохранить процесс поиска данных и одновременно их развертывания в рамках модели, нечасто применяемой к другим платформам. Потребовалось лишь провести различие между физической платформой и логическим окружением.

Время инсайта и время выполнения

Наконец, последняя важная тема, которую следует рассмотреть в контексте управления, связана с тем, какие критерии следует применять для оценки успешности каждого этапа разработки и внедрения аналитического процесса. К сожалению, операционная аналитика может потребовать больше трудозатрат по сравнению с традиционной. В классическом аналитическом окружении процессы выполняются почти исключительно в режиме пакетной обработки, и то же самое окружение используется как для разработки, так и для реализации. В этом случае наибольшее значение имеет время выполнения или скорость обработки. А в едином аналитическом окружении, используемом для операционной аналитики, на разных этапах процесса в игру вступают два совершенно разных критерия.

Это время выполнения процесса, или аналогичная классическая метрика производительности, и время инсайта (о нем мы говорили в четвертой главе). При размещении в операционном окружении аналитические процессы должны выполняться как можно проще и быстрее. В фазе поиска новых инсайтов и определения потребностей, которые нужно сделать операционными, первостепенное значение приобретает время инсайта, а не скорость обработки. Разные требования могут заставить организацию принять другие подходы, отличающиеся от тех, что она использовала традиционно.

Для иллюстрации возьмем ранние фазы обнаружения, когда нужно просто проверить, работоспособна ли идея или нет. На данной стадии не нужно постоянно повторять процесс – просто нужно как можно быстрее получить ответ. Если на написание программы уходит всего один час и еще три часа на выполнение процесса, то это нормально. Ответ будет получен достаточно быстро для того, чтобы понять, имеет ли смысл двигаться дальше в этом направлении или нет. В то же время глупо тратить на написание программы 12 часов, чтобы разработать более эффективный процесс, который будет выполнен всего за несколько минут, поскольку на данный момент неизвестно, потребуется ли повторять этот процесс больше одного раза.

Операционная аналитика требует другого подхода

При поиске новых инсайтов самое главное – обнаружить их как можно быстрее, и поэтому долгое время выполнения процесса не имеет значения. Но при превращении нового инсайта в операционный необходимы максимальные скорость и масштабируемость. Упрощение процесса поиска для превращения его в операционный может потребовать дополнительных усилий.

После обнаружения инсайта, достойного превращения его в операционный, процесс операционализации будет повторяться тысячи или миллионы раз в день. В этом случае на счету будет каждая секунда, если не миллисекунда. Следовательно, имеет смысл потратить дополнительные часы, дни и даже недели на отладку и оптимизацию этого процесса, чтобы добиться максимальной скорости и кратчайшего времени выполнения. Дополнительные усилия позволят повысить производительность миллионов операций и поэтому потребуют очень малых затрат, если распределить их между всеми случаями выполнения процесса. Однако такие действия должны выполняться только тогда, когда подтверждена их окупаемость.

Из вышеуказанных обстоятельств проистекает потенциально раздражающее следствие, которое необходимо принимать во внимание. В некоторых случаях процесс, использованный для обнаружения инсайта, невозможно напрямую перенести в операционный контекст. В процессе поиска только и нужно как можно быстрее добраться до инсайта и доказать его ценность. Иногда те же самые программа, логика и процесс могут быть применены непосредственно в операционном контексте, но в большинстве случаев такое невозможно, что обусловливает применение двухфазного процесса. В первой фазе требуется как можно быстрее доказать ценность инсайта. Во второй фазе – видоизменить программу и архитектуру процесса, использованного для поиска инсайта, таким образом, чтобы он стал достаточно эффективным для операционного окружения.

В действительности на протяжении многих лет для организаций вполне обычным было перепрограммирование аналитических процессов при их переносе с поисковой платформы на операционную. Например, аналитические процессы часто перепрограммировались на язык Cobol для мейнфреймов. Операцию по перемещению процессов можно значительно упростить, если выполнять аналитику в рамках автономного единого аналитического окружения, обеспечивающего совместимость между этапами поиска и операционализации. Вместо того чтобы полностью перепрограммировать все для совершенно другого окружения, можно только упростить процесс с использованием того же набора технологий и инструментов. Это облегчает внедрение по сравнению с прошлой практикой.

Конфиденциальность

Конфиденциальность является одним из важнейших вопросов, связанных с использованием больших данных и операционной аналитики, а также ключевым аспектом управления. Любая организация, имеющая дело с клиентами и особенно с их данными, должна относиться к конфиденциальности предельно серьезно. В то же время конфиденциальности требует и другая уязвимая информация. Сегодня не только количество данных о каждом из нас увеличивается стремительными темпами, но и появляется все больше возможностей сочетать и сопоставить эти данные.

Хотя их использование потенциально может принести огромные преимущества, оно представляет и огромные риски для отдельных людей и общества в целом. Ненадлежащее обращение с данными способно причинить реальный ущерб. Давайте рассмотрим некоторые соображения, которые важно учесть при разработке процессов управления.

Большие данные становятся Большим Братом?

Ваш оператор сотовой связи точно знает, где вы были. Если вы регулярно пользуетесь приложениями с функцией геолокации на вашем смартфоне, то поставщики этих приложений также знают, где вы побывали. Ваш провайдер электронной почты, возможно, хранит копии всех полученных и отправленных вами писем. Ваш провайдер кабельного или спутникового телевидения знает, что вы смотрели, какие рекламные ролики пропустили и когда нажимали на паузу. Ваша кредитная история в файлах у многих организаций, и ваша история болезни оцифровывается все чаще. Теперь вы представляете себе общую картину: все больше и больше третьих лиц узнают о вас все больше и больше, чем когда-либо прежде.

В последние годы резко возросла озабоченность в связи с тем, как многие известные компании и правительственные структуры относятся к вопросам соблюдения конфиденциальности. Google, Yahoo! Facebook, правительство США и многие другие были уличены в реальном или предполагаемом нарушении неприкосновенности частной жизни{50}. Существующая стандартная политика конфиденциальности совершенно неработоспособна, поскольку среднестатистическому человеку невозможно в ней разобраться; вдобавок в ней масса лазеек и она может быть изменена в любой момент. По сути, мы вынуждены доверять компаниям и правительству в том, что они будут обращаться с нашими данными надлежащим образом. К сожалению, наше понимание надлежащего обращения с данными и понимание оного организациями могут не совпадать. Хуже того, многие данные, которые вы считаете своей собственностью, фактически принадлежат не вам, а компаниям, обеспечивающим их создание. Зачастую записи звонков в колл-центр, твиты, выложенные в сетях фотографии и т. п. принадлежат не человеку, который это осуществляет, а владельцу того сервиса, где они были созданы. Создавать данные еще не значит владеть ими.

Большинство людей не имеют представления о том, до какой степени их поведение может отслеживаться (и отслеживается!). Особенно это касается активности в Интернете и использования подключенных устройств. Даже производитель вашего телевизора может шпионить за вами такими способами, о которых вы даже не подозревали{51}. На момент написания этой книги продолжает разгораться скандал, связанный с разоблачением деятельности Агентства национальной безопасности США (АНБ) по сбору данных о людях. Будь то прослушивание телефонных звонков, перехват электронных писем или слежка за коммуникациями иностранных лидеров, АНБ явно зашло гораздо дальше, чем представляет себе большинство людей. И это лишь то, что известно нам{52}. А те немногие, кто знает о том, что еще происходит, молчат. На рис. 6.2 приведены некоторые ключевые вопросы, требующие разъяснения.

По мере того как в городах по всему миру расширяется установка камер с возможностью распознавания лиц, становится возможным отслеживать передвижения людей. Изображения с камер уже используются для поиска преступников, позволяя проследить за ними от места преступления до их убежища. Однако, хотя становится все труднее сохранить свои действия и местоположение в тайне, многие люди не видят в этом большой проблемы. Они говорят, что личная жизнь у большинства из нас скучна и ничем не примечательна. Если вы не совершаете ничего из ряда вон выходящего или противозаконного, то как вам может повредить информация, попавшая в чужие руки?

Аргумент звучит замечательно, пока кто-то во власти не решит использовать эти данные против вас. Например, правительство США было уличено в использовании данных федеральной Службы внутренних доходов для воздействия на политические группы и отдельных лиц, чьи политические взгляды расходились со взглядами администрации{53}. Как вы отнесетесь к тому, что некто захочет повлиять на ваши взгляды или на ваше участие в абсолютно законной деятельности? Информация и данные – это валюта современного мира, поэтому защищайте свои активы. Сегодня для банка важны не только сами деньги, лежащие в его хранилище, но и информация, связанная с этими деньгами.

Где провести границы?

Каждый из нас проводит зыбкие границы, обозначающие комфортную зону, где наша частная жизнь неприкосновенна. Хотя мнения о том, где именно должны проходить эти границы, могут разниться, но самое главное – такие границы должны быть проведены. Сегодня они в лучшем случае размыты, а в худшем и вовсе отсутствуют.

Законы, определяющие конфиденциальность, меняются и совершенствуются. Две обсуждаемые в последнее время темы требуют особого упоминания вследствие их важности и противоречивости связанных с ними судебных решений. Первая сопряжена с дебатами о том, являются ли данные о местоположении абонентов сотовой связи или данные автомобильной телематики личными и подлежащими защите, или же правоохранительные органы могут получать к ним доступ без ордера. Вторая горячая тема относится к шпионской программе АНБ. Давайте рассмотрим обе темы подробнее.

Что касается первого вопроса, то правительство США утверждает, что данные о местоположении абонентов сотовой связи и данные автомобильной телематики не являются частными. Правительство заявляет: когда люди включают сотовый телефон или садятся в машину, они заведомо знают о том, что все их перемещения могут быть отслежены, и, таким образом, отказываются от своего права на защиту конфиденциальности данных. Частично логика рассуждений правительства основывается на том, что данные фактически уже собираются компаниями, а поэтому не принадлежат людям и не подпадают под защиту законов. В сентябре 2013 г. было вынесено два судебных решения. В первом случае суд постановил, что для доступа к информации о местоположении абонента правоохранительные органы должны были получить судебный ордер{54}. Во втором случае суд вынес решение, что такой ордер не требовался{55}. Этот вопрос в конечном итоге станет рассматривать Верховный суд, и его окончательное решение будет иметь далеко идущие последствия.

Что касается второго вопроса, то АНБ утверждает, что оно имеет право собирать широкий спектр информации о гражданах, даже если они не подозреваются в правонарушениях. Широта охвата подобной деятельности АНБ стала неприятной неожиданностью для большинства людей. Как и в вышеописанной ситуации с данными о местоположении сотовых абонентов, мнения судов по этому вопросу разделились. Один суд вынес решение, что деятельность АНБ является совершенно законной, тогда как другой суд через несколько недель счел такую деятельность незаконной{56}. Этот вопрос также будет рассматриваться в Верховном суде для вынесения окончательного решения.

Напоследок стоит упомянуть еще один удивительный факт. В Соединенных Штатах 87 % населения может быть однозначно идентифицировано только на основе имени, даты рождения и почтового индекса{57}. Если такой минимальной информации достаточно для точного определения того, кто вы есть, представьте, как легко идентифицировать вас при помощи всех прочих данных, которые собираются сегодня. Хотя мнения о том, где именно должны быть проведены зыбкие границы, могут разниться, несомненно одно – мы должны где-то провести эти границы.

Но довольно пессимизма. Теперь давайте рассмотрим некоторые практические примеры соблюдения конфиденциальности. После этого обсудим, что конкретно должна делать ваша организация, чтобы поддерживать правильный баланс в этой важной области.

Установите стандарты конфиденциальности

Как создать такие стандарты конфиденциальности, чтобы ваша организация не оказалась в центре громкого скандала в связи с нарушением неприкосновенности частной жизни? Я рекомендую организациям принимать во внимание три критерия, чтобы гарантировать, что они не нарушают доверие своих клиентов и широкой общественности{58}:

1. Что является законным?

2. Что является этичным?

3. Что является приемлемым для клиентов и широкой общественности?

В идеальном мире эти три критерия должны полностью совпадать. Но сегодня они не совпадают совсем. Постепенно регулирование должно охватить все аспекты конфиденциальности, а люди должны стать более осведомленными. К сожалению, сейчас рамки законного выходят далеко за рамки этичного, а рамки этичного могут выходить за рамки приемлемого для людей.

Крупная компания розничной торговли Target демонстрирует нам наглядный пример того, как можно успешно пройти два первых теста и с треском провалиться на третьем. У Target есть программа лояльности, которая по всем меркам соответствует действующим законам. Когда потребители регистрируются в этой программе, они соглашаются с тем, что им будут делаться целевые предложения на основе их покупательского поведения. Поскольку такие предложения оговариваются в соглашении, Target не выходит за рамки этики, когда использует данные о потребителях для изучения их покупательских привычек и предложения им товаров. Ошибка Target состояла в том, что в своем использовании аналитики она вышла за пределы комфортной зоны покупателей, хотя ее действия оставались законными и этичными.

Применяйте трехуровневый тест

При оценке приемлемости анализа с точки зрения конфиденциальности убедитесь в том, что он проходит три разных теста. Анализ должен быть: (1) законным, (2) этичным и (3) приемлемым для клиентов. Последнее условие часто является самым строгим.

Target научилась выявлять беременность на очень ранних стадиях – настолько ранних, что компания могла узнать о беременности еще до того, как сама покупательница сообщала о ней другим. В результате это привело к истории, описанной в New York Times, когда отец 17-летней дочери получил адресованное ей письмо с предложением товаров для беременных{59}. Отец отправился к директору местного магазина Target и обрушился на него с обвинениями в том, что такие неподобающие товары предлагаются девушке-подростку. Через неделю отец вернулся и извинился перед директором магазина за свои нападки. Оказалось, что его дочь действительно была беременна. Однако широкая общественность склонилось не на сторону Target. Люди посчитали подобное использование аналитики недопустимым.

Всегда помните: недостаточно определить, что законно и что этично. Нужно задуматься и о том, что подумают о ваших действиях клиенты и широкая общественность.

«Уловки-22»[4] применительно к конфиденциальности

На частном мероприятии, где я присутствовал, генеральный директор больничной сети поведал историю о том, в каком рискованном положении может оказаться организация из-за неоднозначности сегодняшних законов и этических норм касательно использования данных{60}. Речь шла о сборе и хранении генетических данных, а также о грузе обязательств, которые несет с собой эта деятельность.

Предположим, что клиника сохраняет результаты анализа вашей ДНК у себя в файле. Но что если спустя три года будет сделано важное открытие, которое свяжет определенные генетические признаки с серьезным заболеванием? Обязана ли клиника по закону или с точки зрения медицинской этики провести анализ всей своей базы данных о ДНК с целью выявления пациентов, находящихся в зоне риска? Как часто необходимо проводить такой ретроспективный анализ и каковы будут связанные с ним затраты?

Неоднозначность создает риски

Неоднозначность правовых и этических норм, прописывающих, что приемлемо или надлежит делать в тех или иных ситуациях, только увеличивает риски, связанные со сбором данных. Организация вполне может оказаться в ситуации, когда она проиграет судебный иск, какое бы решение до этого ни приняла. Будьте предельны осторожны в таких ситуациях, которые могут закончиться «уловкой-22».

Невозможно спрогнозировать затраты на выполнение неизвестного количества анализов неизвестной сложности для всего объема данных, хранимых в базе данных клиники. Будущие затраты на хранение данных нельзя в полной мере оценить сейчас, поскольку невозможно заранее предсказать, сколько корреляций может быть открыто учеными и насколько трудно будет осуществить анализ, чтобы определить риски. Это также создает ситуацию в духе «уловки-22». Кое-кто может подать на клинику в суд, если она проанализирует персональные данные и проведет новые тесты без разрешения. Они предпочли бы не знать о плохих новостях, особенно в тех случаях, когда помочь невозможно. Другие подадут в суд, если у клиники была возможность выявить проблему посредством такого анализа, но она этого не сделала. Вполне вероятно, что в обоих случаях суд признает клинику виновной. Кроме того, существуют риски, связанные с кражей или ненадлежащим использованием данных ДНК. Все эти неопределенные факторы, сопряженные с хранением генетических данных, вызывали у генерального директора серьезную обеспокоенность.

Он рассказал нам об удивительном решении этой проблемы. Больничная сеть планирует отказаться от хранения данных ДНК за пределами того срока, который требуется для проведения неотложных тестов. Учитывая многочисленные неопределенные факторы, связанные с юридическими и финансовыми последствиями хранения генетических данных, больничная сеть не хочет хранить их дольше, чем необходимо. Пока эти факторы не будут четко определены, компания решила, что возможные риски намного перевешивают возможные выгоды.

Жаль, что сегодняшние законы ставят организации в положение, когда они вынуждены принимать подобные неожиданные решения. Тем не менее я хорошо понимаю генерального директора. Если бы я руководил этой компанией, то, скорее всего, принял бы точно такое же решение. Пока законы не будут прояснены, сохранятся риски и ответственность, сопряженные со сбором и хранением данных, связанных с конфиденциальностью.

Будущее политики конфиденциальности

Политика конфиденциальности должна развиваться и совершенствоваться, чтобы соответствовать сегодняшним реалиям. Ваша организация должна располагать не только подготовленным юристами 100-страничным документом с изложением политики конфиденциальности, но и ее гораздо более сжатым и доступным для понимания резюме, в котором доходчиво и четко излагается, что ваша организация собирается делать с уязвимыми данными и какие границы она не будет переступать{61}.

Политика конфиденциальности должна стать гораздо более гибкой с тем, чтобы позволить клиентам выражать свои предпочтения. Сегодня уже недостаточно иметь простой перечень, озаглавленный «Не звонить» или «Не отправлять имейлы». Возможно, я не хочу получать звонки или письма с предложением не интересующих меня продуктов, но хотел бы получать информацию о возможностях обновления продуктов, которыми уже владею. Например, мой банк может звонить мне, чтобы предложить более выгодную схему ипотечного кредита по сравнению с той, что у меня уже есть, но я не хочу, чтобы мне звонили по поводу сберегательного счета.

Сегодняшние реалии требуют совершенно новых уровней конфиденциальности. Например, если взять данные о местоположении абонентов, собираемые операторами сотовой связи, то одни абоненты могут быть категорически против того, чтобы отслеживались их передвижения, и не важно по каким причинам. Другие могут хорошо относиться к тому, что оператор посылает им маркетинговые предложения на основе их текущего местонахождения, при условии что он немедленно удаляет эту информацию и не будет использовать ее в будущем. Наконец, третьи не возражают, если оператор будет хранить информацию об их передвижениях на протяжении длительного времени и использовать ее для различных аналитических целей. Это означает, что организации, чтобы соответствовать растущим ожиданиям клиентов в отношении соблюдения конфиденциальности, должны разработать широкий набор детализированных настроек, с помощью которых клиенты смогут управлять всеми типами собираемых данных.

Гибкость и прозрачность политики конфиденциальности – залог доверия

Хотя этим и сложнее управлять, но предоставление клиентам возможности устанавливать детализированные ограничения касательно конфиденциальности поможет организации защититься от проблем. Кроме того, поскольку сегодня очень немногие организации пользуются высоким доверием в отношении соблюдения конфиденциальности, такой подход может стать конкурентным преимуществом.

Должно стать обычным делом в понятной форме уведомлять клиентов об изменениях в своей политике конфиденциальности и задолго до того, как они вступят в силу. Действовать по умолчанию должны самые консервативные пользовательские настройки. Например, хорошая практика – использовать всплывающее окно, которое заставляет пользователя при первом посещении сайта после введения изменений подтвердить свое знание новой политики и выбрать персональные настройки. Сделанный им выбор следует осуществить как можно быстрее. Причем пользователь должен иметь возможность сделать активный и сознательный выбор, а не просто прочитать где-то в закоулках сайта расплывчатое уведомление об автоматическом изменении параметров конфиденциальности.

Разумеется, управлять политикой конфиденциальности таким образом гораздо сложнее, однако это абсолютно необходимо, если организация хочет предоставить клиентам ту степень контроля над персональной информацией, которую они хотят и которой заслуживают. Усилия, направленные на то, чтобы позволить клиентам чувствовать себя комфортно в отношении способов хранения, анализа и использования их персональных данных, окупятся. Предоставление людям бльшего контроля не только защитит организацию с юридической точки зрения, но и повысит удовлетворенность ее клиентов, поскольку организация пойдет навстречу их пожеланиям. Надежная и гибкая политика конфиденциальности может обеспечить организации весомое преимущество перед ее конкурентом, попавшим в новости из-за очередного скандала, вызванного нарушением конфиденциальности.

Подведем итоги

Наиболее важные положения этой главы:

• Как и в случае новояза в романе «1984», чрезмерно ограничительные правила могут пресечь новые вопросы относительно данных. Введите различные категории допуска, чтобы обеспечить доверенным профессионалам необходимую гибкость действий.

• Для достижения успеха с операционной аналитикой ИТ-команда и аналитическая команда должны работать совместно. Если команды не идут на сотрудничество добровольно, руководство должно принудить их к сотрудничеству.

• Интернет вещей будет создавать высокое отношение шумов к сигналам. Хотя он и станет генерировать один из крупнейших пулов необработанных данных, но лишь очень небольшая их часть будет иметь ценность за пределами текущего момента.

• Выбор наилучшего способа выполнения аналитического процесса может оказаться нелегким. Не обостряйте отношения, утверждая, что тот или иной подход не будет работать; вместо этого сосредоточьтесь на поиске лучшего подхода из всех возможных.

• Оптимизируйте аналитический процесс в масштабах всего аналитического окружения, а не отдельного компонента. Чтобы максимизировать получаемую ценность, задействуйте все доступные возможности.

• Операционная аналитика предъявляет два различных набора требований. На этапе обнаружения данных требуется максимум гибкости и минимум ограничений. На этапе внедрения приоритет следует отдавать обеспечению скорости, надежности и стабильности.

• Ввиду автоматического характера операционной аналитики иногда она будет давать сбои, как и любая автоматизированная производственная линия. Главное – действовать быстро, чтобы минимизировать ущерб, поскольку на устранение проблем приходится меньшая часть издержек при ведении бизнеса.

• Операционно-аналитические процессы требуют мониторинга и контроля, как и любые другие процессы. К ним применимы и классические стандарты бизнес-аналитики.

• Различные метрики достижений, такие как время инсайта, необходимо применять для обнаружения данных, а традиционные метрики, такие как время выполнения процесса, по-прежнему пригодны для операционных процессов.

• Конфиденциальность представляет сегодня огромную проблему для больших данных и аналитики. Хотя мнения о том, какими именно должны быть границы конфиденциальности, разнятся, несомненно одно – мы отчаянно нуждаемся в таких границах, чтобы избежать эпохи Большого Брата.

• Любое действие, влияющее на конфиденциальность, должно быть законным, этичным и приемлемым для общественности. Будьте предельно осторожны, поскольку эти три критерия не всегда совпадают и могут привести к ситуации в духе «уловки-22».

• Политика конфиденциальности и ее настройки должны совершенствоваться, чтобы отражать устойчивые данные и усложнившиеся требования современного мира. Это не только позволит свести к минимуму юридические риски, но и станет конкурентным преимуществом для организации.

Часть III

Превращаем традиционную аналитику в операционную

Глава 7

Аналитика

В этой главе мы сосредоточимся на аналитических концепциях, позволяющих организации превратить аналитику в операционную. Как мы увидим, далеко не все ново под луной в мире операционной аналитики, но возникают и новые уникальные проблемы, которые важно понимать и учитывать.

Не забывайте о том, что превращение традиционной аналитики в операционную происходит эволюционно, поэтому многие уроки и принципы из прошлого, связанные с разработкой аналитических процессов, точно так же применимы и в настоящем, но с некоторыми изменениями. Организации, уже хорошо освоившие использование аналитики и располагающие в штате крепкими командами аналитиков-специалистов, вправе рассчитывать на успех.

Создание операционно-аналитических процессов

Мы дали определение операционной аналитики в первой главе. Здесь же начнем с рассмотрения ряда тем касательно создания и внедрения операционной аналитики. Как вы увидите, она имеет много общего с традиционной пакетной аналитикой, поэтому вам не придется начинать с нуля. Но в то же время это означает, что организации не могут прыгнуть сразу же на уровень операционной аналитики, если у них нет никакого опыта работы с традиционной пакетной аналитикой.

Постоянство аналитического процесса

Когда появились большие данные и в мир аналитики начали приходить люди с разной подготовкой, начались дебаты о том, не потребуется ли для аналитики новый рабочий процесс. Нет, не потребуется. На фундаментальном уровне рабочий процесс является одинаковым для всех типов данных и аналитики. Подобное постоянство замечательно, поскольку избавляет нас от необходимости каждый раз заново изобретать колесо, когда нам нужно применить аналитику новым способом или использовать новые источники данных.

Я был свидетелем споров по поводу того, представляет ли анализ больших данных нечто новое. Помню, как в ходе жарких дебатов утверждал, что в обнаружении больших данных нет ничего нового. Чтобы положить конец спорам, я показал своим оппонентам модель межотраслевого стандартного процесса анализа данных (Cross Industry Standard Process for Data Mining, CRISPDM), разработанную в 1990-х гг. Модель CRISP-DM описывает основные шаги в классическом процессе анализа данных. Я поместил схему процесса CRISP-DM рядом с предложенной схемой процесса обнаружения больших анных. Также нарисовал таблицу, где сопоставил отдельные этапы каждого процесса. Один из моих оппонентов, ранее утверждавший, что это были разные процессы, воскликнул: «Постой, Билл, но это практически то же самое!» Наконец-то они поняли мою точку зрения. Да, слегка были изменены термины и семантика, но фундаментально «новый» процесс ничем не отличался от «старого». В таблице 7.1 показано сходство фаз этих двух моделей, тогда как на рис. 7.1 представлена схема типового аналитического рабочего процесса.

Еще одна популярная парадигма – модель SEMMA, разработанная компанией SAS Institute{62}. Аббревиатура SEMMA расшифровывается как sample (отобрать), explore (исследовать), modify (модифицировать), model (моделировать) и assess (оценить). На веб-странице SEMMA говорится: модель предполагает, что бизнес-задача уже определена, а внедрение рассматривается как дополнение завершающей фазы. И снова обратите внимание на то, что эта модель мало чем отличается от модели CRISP-DM и модели обнаружения больших данных, как это можно увидеть в таблице 7.1.

Тот факт, что разные модели аналитических рабочих процессов, разработанные в разные годы и с использованием разных подходов, столь схожи между собой, свидетельствует о том, что, перефразируя слова великого Шекспира, в аналитическом безумии есть свой метод. Переход к аналитике больших данных, операционной аналитике или к следующему феномену будет опираться на знания, которыми уже обладают организация и ее команды.

От пакетной аналитики к операционной

Давайте начнем с рассмотрения сходства и несходства между традиционной пакетной аналитикой и операционной аналитикой. Во-первых, и операционная, и пакетная аналитика требуют значительных усилий по подготовке и проверке качества данных. Например, если требуется оценить риск ухода клиента, вероятность продажи продукта или риск отказа двигателя в течение нескольких следующих минут, то нужно будет получить необходимые данные, проверить их качество и подготовить правильные метрики для поддержки требуемого анализа.

Операционная аналитика сосредоточена на обработке данных и принятии решений в режиме реального времени и, как правило, применяется к конкретному клиенту, продукту или двигателю именно в тот момент, когда это необходимо. Тем самым она отличается от пакетной аналитики, где данные по всем клиентам, продуктам или двигателям анализируются одновременно в виде единого пакета и в произвольное время. Во многих случаях аналитические методы, используемые при операционном вводе данных, идентичны тем, что используются при традиционной пакетной обработке. Разница состоит лишь в том, как выполняются и применяются эти процессы.

Например, те же самые алгоритмы, что использовались с целью прогнозирования следующего лучшего предложения для всех клиентов при пакетном анализе, могут использоваться и с целью прогнозирования следующего лучшего предложения для конкретного клиента, который прямо сейчас просматривает веб-сайт. Разница в том, что процесс генерации предложения для клиента в режиме реального времени опирается на самые свежие данные. Разумеется, в некоторых случаях операционно-аналитические процессы потребуют абсолютно новую аналитику, у которой не существует исторических аналогов. Возьмите, например, процессы, регулирующие угол наклона лопастей ветряных турбин с целью увеличения их мощности в зависимости от окружающих условий, о чем мы говорили в третьей главе.

Операционная аналитика стоит на прочном фундаменте

Вы не можете наладить производство миллионов штук печенья с шоколадной крошкой без рецепта и налаженного производственного процесса. Рецепт можно будет разработать, а процесс наладить путем тестирования на мелких партиях. Аналогичный подход применяется и в операционной аналитике. Сначала нужно создать работающий базовый процесс, а уже затем превращать его в операционный.

Ключевой момент – во многих случаях операционно-аналитический процесс представляет собой просто более интегрированную, сдвинутую к режиму реального времени версию пакетного аналитического процесса. Вот почему, прежде чем внедрять операционную аналитику, организация должна достичь мастерства в применении традиционной аналитики. Это ничем не отличается от ситуации на промышленном производстве, когда сначала изготавливаются формы и прототипы изделия, которое потом будет изготовляться на сборочной линии. Подобно тому как производство новой модели мобильного телефона начинается с создания опытных образцов и тестирования производственного процесса на небольших партиях изделий, точно так же абсолютно необходимо сначала разработать прототип аналитического процесса и протестировать его в небольшом масштабе, прежде чем его автоматизировать. Для того чтобы наладить производство чего угодно, от мобильных телефонов до замороженной пиццы, вы должны пройти ключевые этапы дизайна, производства опытных образцов и утверждения процесса. Вы не сможете запустить массовое производство миллионов штук печенья с шоколадной крошкой, пока у вас не будет проверенного рецепта и отлаженного производственного процесса, которые позволят вам изготовить пробную партию с десяток вкусняшек.

Как говорилось в шестой главе, операционно-аналитические процессы тоже требуют постоянного контроля и регулярной модернизации. Я рекомендую прочитать вам хорошую статью на эту тему – «Одержимость качеством в Western Digital Corporation» Ричарда Хакаторна из компании Bolder Technology{63}. В статье рассматриваются конкретные примеры касательно качества данных, управления, реализации и мониторинга операционной аналитики.

Операционная аналитика – это…

Еще один важный угол зрения, под которым следует рассматривать действия по превращению аналитики в операционную, заключается в том, что операционная аналитика – это… подождите, подождите… просто аналитика! Я уже писал о том, что аналитика больших данных – это просто аналитика{64}. Теперь повторю то же самое: операционная аналитика – это просто аналитика.

Тем самым я вовсе не хочу сказать, что внедрение больших данных или операционной аналитики требует минимальных усилий. То и другое представляет собой довольно трудную задачу и нуждается в новых инструментах, технологиях и навыках. Просто я хочу подчеркнуть, что необходимые действия не являются чем-то абсолютно новым и неизвестным. Скорее, они представляют собой естественное продолжение стремлений организаций и специалистов-аналитиков увеличить количество и разнообразие источников данных и аналитических методов, с тем чтобы усовершенствовать принятие бизнес-решений.

Операционная аналитика – это…

… просто аналитика! Не упускайте из виду сей простой факт.

Если вы сами являетесь специалистом-аналитиком или у вас есть в штате такие классные профессионалы, вам нечего бояться операционной аналитики. Специалисты обеспечивали эволюцию аналитических процессов в прошлом, и точно так же они обеспечат эволюцию этих процессов для выведения их на операционный уровень. Определят бизнес-проблему и требуемые для ее решения источники данных. Затем исследуют эти данные, подготовят их и проанализируют. Включат данные в аналитический процесс, который протестируют, прежде чем масштабируют его на операционном уровне. Маршрут во многом останется тем же, что и в прошлом. В конце концов цель превращения традиционной аналитики в операционную состоит в увеличении числа аналитических процессов для поддержки бизнеса.

Новые аналитические дисциплины

Как говорилось во второй главе, большие данные часто представляют собой особый тип данных с принципиально иной структурой. Новые структуры данных могут потребовать других способов обработки для включения этих данных в аналитический процесс. Соответственно организации придется осваивать новые аналитические дисциплины. В этом разделе мы дадим им определение, расскажем о том, как их можно сочетать и как это сочетание способно создать ценности.

Определение аналитических дисциплин

Современная деловая среда требует все более широкого спектра аналитики. Когда я только начинал заниматься аналитикой, большинство аналитических процессов, используемых крупными компаниями, относилось к одной из двух ключевых дисциплин. Первая – это статистика, включающая в себя что угодно – от дисперсионного и регрессионного анализа до проверки статистической значимости. Вторая – это прогнозирование, включающее в себя классические временные ряды и проекционные способы. Однако в современном мире эти две аналитические дисциплины больше не в состоянии удовлетворить всех потребностей бизнеса, нуждающегося в выходе за пределы статистических и прогностических методов. Давайте рассмотрим несколько новых аналитических дисциплин.

Страницы: «« 12345678 »»

Читать бесплатно другие книги:

О системе технического анализа, которая отлично известна на Востоке, а на Западе лишь робко изучаетс...
Из начала двадцать первого века – в конец века девятнадцатого. Да полно, а только ли отсюда туда? С ...
Цель этой книги – увидеть за внешней оболочкой тела органы и системы жизнеобеспечения, понять, как и...
Екатерина Мурашова – известный семейный и возрастной психолог. Помимо своей основной, консультационн...