«Качество этих — 2022»: практика

«Качество данных — 2022»: практика

Основной вопрос бизнеса, ответ на который постарались дать выступавшие на конференции «Открытых систем» эксперты-практики, таков: зачем заниматься управлением качеством этих?

Одна из секций конференции «Качество данных (зарегистрированная информация:439; представление фактов, понятий или инструкций в форме, приемлемой для общения, интерпретации, или обработки человеком или с помощью автоматических средств (ISO/IEC/IEEE 24765-2010)) — 2022», проведенной издательством «Отворённые системы», была посвящена анализу опыта управления качеством данных в организациях (группа людей, деятельность которых сознательно координируется для достижения общих целей) разных сфер деятельности.

Владимир Комолов из компании DM Basis отозвался в своем выступлении, пожалуй, на главный бизнес-вопрос: зачем заниматься управлением качеством данных? DM Basis занимается разработкой и поддержкой программных продуктов для автомобильного базара — от качества данных зависит приток покупателей. Качественные данные обеспечивают двукратный рост объемов торговель: в условиях рынка наличие полной и достоверной информации становится одним из основных рычагов для увеличения доходов. Особенность этих в этом сегменте — естественное устаревание из-за длительного бизнес-цикла. Обновление продуктовой линейки автомобилей спрашивает от компаний значительного времени, при этом собранные ранее данные о клиентах теряют актуальность. Как показывает статистика, повышение качества этих в рамках программы Customer Experience способно поднять объем повторных продаж вдвое — с 10% до 23% для премиальных марок автомашин, а для некоторых моделей (система, исследование которой служит средством для получения информации о другой системе; представление некоторого реального процесса, устройства или концепции) — с 12% до 45%. Благодаря этому удержание действующего клиента обходится втрое недороже, чем привлечение нового.

«Качество данных — 2022»: практика

Сергей Горшков: «Нет абсолютно надежных инструментов проверки истинности данных, однако можно минимизировать вероятность появления случайных или преднамеренных ошибок»

Наиболее существенный признак качества данных — их достоверность, считает Сергей Горшков из компании «ТриниДата», какая предлагает платформу «АрхиГраф», позволяющую выстроить дата-центрическую архитектуру системы хранения данных и гарантировать цикл проверки истинности информации в корпоративных системах. Недостоверная информация может появляться по разным причинам — так, из-за случайных или преднамеренных ошибок менеджеров. Возможно также различное толкование данных разными клиентами: разночтение способно породить недостоверную трактовку итогов, поэтому при эксплуатации корпоративных систем надо гарантировать единство толкований. Встречаются и более сложные случаи — так, фактор модальности больших массивов данных, достоверность которых зависит от появления тех или иных событий, в случае возникновения каких необходимо запускать процесс перепроверки данных. Скажем, установка признака «недобросовестный контрагент» может выражать модальное субъективное предложение менеджера: «этот контрагент может стать недобросовестным и наверняка вовремя не погасит задолженность». В рамках традиционных информационных систем, опирающихся на реляционные базы этих и «зашитую в коде» модель данных, нет удовлетворительного решения (многозначный термин) обеспечения истинности данных. Системы (множество элементов, находящихся в отношениях и связях друг с другом, которое образует определённую целостность, единство), созданные на основе онтологических моделей этих и предназначенные для поддержки принятия решений в организации, которая работает в динамичной окружающей среде, потенциально могут решать подобные задачи. Для контроля достоверности этих, отметил Горшков, применяются системы управления основными данными (Master Data Management, MDM), помогающие унифицировать организованные во всех информационных системах данные и эффективно управлять ими. Сегодня также активно развиваются инструменты для извлечения неструктурированных этих, основанные на машинном чтении (natural-language understanding) и других технологиях искусственного интеллекта.

О внедрении в банке «Открытие» системы «Целого фронтального решения» (ЕФР) рассказали Иван Зипухо и Мария Филюшкина при участии Ники Сусловой из компании HFLabs. Проект, запущенный в 2018 году, предусматривал союз четырех решений категории CDI (Customer Data Integration), собравшихся вместе при объединении банков «Открытие» и «Бинбанк». Разработчикам требовалось слить 40 млн клиентских записей от банка «Открытие» и 55 млн записей от «Бинбанка». Сведение этих происходило с помощью ЕФР, разработкой которой занималась компания HFLabs. После клининга размер этого хранилища сократился до 35 млн клиентских записей (означает процесс фиксации данных для сохранения на носителях информации, а также сам результат этого процесса). Выстраивание системы управления качеством этих для ЕФР стало одним из наиболее значимых решений при строительстве новой системы. Объединенному банку (сосуд, как правило, цилиндрической формы с широким отверстием вверху, в отличие от бутылки, с достаточно короткой и широкой горловиной либо вообще без горловины, с крышкой, предназначенное для хранения различных продуктов) потребовалось выстроить новоиспеченную схему сбора сведений о клиентах (Клиент (от лат. cliens, множ. clientes) — в Древнем Риме свободный гражданин, отдавшийся под покровительство патрона и находящийся от него в зависимости), которая способствовала как повышению («» (англ) качества данных, так и унификации процессов сопровождения этих и их синхронизации в базе. Сегодня в банке работает микросервисная платформа омниканальных сервисов, насчитывающая на текущий момент немало 200 доменных микросервисов и более 100 отдельных баз данных. Благодаря выстроенной системе управления качеством этих на базе (База — место временного хранения товаров, например: «овощная база») ЕФР, удалось вдвое увеличить скорость обучения новых сотрудников правилам поддержки банковских продуктов и втрое ускорить оформление клиентских сервисов. В то же пора в несколько раз вырос штат дата-стюардов.

«Качество данных — 2022»: практика

Ника Суслова: «Создание единой точки входа для обработки сведений (слово при различном ударении имеет различные значения) о клиенте банка позволило изменить саму цивилизацию работы с данными»

«Без учета качества данных невозможно создать эффективное производство (процесс создания какого-либо продукта с использованием первичных (труд и капитал) и промежуточных факторов производства (сырье, материалы и тому подобное))», — уверен Ярослав Урбанский, воображающий фармацевтическую компанию (может означать: Компания (фр. compagnie) — название формирования, в России ей соответствует рота (пример, Лейб-компания)) «Р-Фарм», сумевшую за три месяца запустить в Москве завод по производству вакцины Sputnik V, что было бы невозможно без верно выстроенных процессов управления качеством данных. Особенность бизнеса «Р-Фарм» — жесткие заявки регуляторов рынка. Высокие стандарты проявляются в требованиях к качеству хранимых данных по различным процессам производства лекарственных оружий, по их номенклатуре, ингредиентам, по срокам реализации продукции и объемам поставки. Как отметил Евгений Антропов, директор отделения управления мастер-данных компании IBS, задачей проекта было не попросту согласование мастер-данных между различными заводами «Р-Фарм», предъявляющими разные требования к качеству этих, а поддержка связности информационных потоков в технологических процессах на разных площадках: от планирования выпуска, закупок сырья, производства — до торговли лекарств. Для повышения качества данных была проведена их структуризация, что позволило сформировать достоверные методики анализа торговель и финансовой отчетности. Был также создан многомерный классификатор.

Дина Татаркина из холдинга «Черкизово» отметила в своем выступлении, что попечение о качестве данных можно переложить на партнеров. В состав холдинга входит 9 птицеводческих хозяйств, 11 предприятий мясопереработки, 19 складских комплексов, 9 комбикормовых заводов, 16 свиноводческих хозяйств. В ведении компании насчитывается немало 500 справочников. На первых порах сведения в систему вводили сами пользователи, что отрицательно сказывалось на качестве (Качество — философская категория) этих: дублирование, некорректные или устаревшие данные, отсутствие унификации в структуре и форматах. Выстраивание единой системы хранения этих началось с их централизации. Была создана система справочников с интерфейсом через портал Alfresco и интеграцией с «1С» и Opentext. Затем сделалась внедряться система мастер-данных с интеграцией во все учетные системы компании. Была осуществлена настройка модели управления мастер-данными сквозь систему SAP MDG. Для источника мастер-данных (основными данными (управление мастер-данными, англ) был выбран интерфейс API сервиса «СПАРК» от группы «Интерфакс», обеспечивающего сбор (многозначное слово) и регулярную проверку (Тестирование Инвентаризация Допинг-контроль Проверка подлинности Служебная проверка Проверка орфографии Проверка на дорогах Камеральная налоговая проверка Выездная налоговая проверка Проверка статистических гипотез Проверка моделей Тройная проверка Докимасия Проба (значения) Спецпроверка Контроль Фейсконтроль Аудит Аудиторская проверка) качества накопленных этих. Для сверки используется более 300 открытых источников. Данные из «СПАРК» (более 90 тыс. записей) сделались основой для наполнения мастер-системы «Черкизово», предоставляющей данные для более 1200 пользователей холдинга.

«Качество данных — 2022»: практика

Евгений Антропов: «Проект согласования мастер-данных между различными фармацевтическими предприятиями позволил решать и бизнес-задачи благодаря поддержке связности информационных потоков»

О специфических особенностях работы (может означать: Работа — это выполнение действий во времени и пространстве с применением силы) с данными некоммерческих организаций рассказала Вера Адаева, представитель Агентства стратегических инициатив. В этом секторе нет традиционных показателей, используемых в бизнес-аналитике: выручки, посредственного чека клиента и проч. Сбор исходных данных затруднен, в том числе и по этическим соображениям — имеются сложности со сбором отчетов от партнеров. В то же пора НКО — это крупные организации, и задача снижения издержек для них актуальна, как и для коммерческих компаний. Для дальнейшего роста им необходим системный сбор этих и обеспечение (долга — залог Обеспечение валюты золотом и серебром — Биметаллизм Обеспечение валюты золотом — Золотой стандарт, МонометаллизмТехникаМатематическое обеспечение Программное обеспечениеВоенное делоТыловое обеспечение Оперативное обеспечение Тактическое или боевое обеспечение.ЮриспруденцияОбеспечение иска) их качества. Особенность НКО — широкий диапазон источников данных, среди которых значительный объем персональных, спрашивающих строгой защиты. В таких условиях важно правильно выстроить метрики для бизнес-анализа, считает Адаева, что помогает определиться с комплектом собираемых данных, обеспечить прозрачность целей при управлении (Управление — целенаправленное воздействие на процессы для изменения их прохождения с целью достижения желательного результата или избегания нежелательного) региональной сетью.

Доклад Михаила Петрова из Счетной палаты РФ был посвящен особенностям (или сингулярность в математике, — это точка, в которой математический объект (обычно функция) не определён или имеет нерегулярное поведение (например, точка, в которой функция имеет разрыв или недифференцируема)) труды с данными в системах госуправления. Главная отличительная черта — масштаб данных и разнородный доступ к ним. Например, в 2021 году в информационной системе Счетной палаты (старорусское слово, для обозначения дома или дворца) насчитывалось 645 комплектов данных. Из них доступ к 24 наборам осуществляется через API, к 361 — через ссылку на открытый источник (или Источники, может употребляться в следующих значениях: Источник (природный), ключ, родник — выход подземных вод на поверхность), и лишь 13 наборов данных предоставляют свой интерфейс к информационной системе. При этом до сих пор используется передача на физических носителях. Такая неоднородность порождает разнообразность форматов: Excel, CSV, XML, JSON, а также «немашиночитаемые» форматы. В Счетной палате выстроена трехуровневая система обучения, а любой сотрудник (или сотрудник, — субъект трудового права, физическое лицо, работающее по трудовому договору у работодателя и получающее за это заработную плату), получающий доступ к труду с данными, обязан иметь хотя бы первый уровень. Высший уровень компетенции требуется для 5–10% сотрудников группы поддержки. Для обеспечения качества этих необходим не просто обученный персонал, а сотрудники, готовые самостоятельно выявлять проблемы с данными, формулировать гипотезы и находить верные решения.

Евгений Линник из Российского футбольного союза рассказал о проекте (Проект в инженерной деятельности (соответствует англ. design от лат. designare «размечать, указывать, описывать, изобретать») — целостная совокупность моделей, свойств или характеристик, описанных в форме, пригодной для реализации системы (SEBoK):272 Является результатом проектирования — процесса определения архитектуры, компонентов, интерфейсов и других характеристик системы или её части (ISO 24765)) управления данными в общественных организациях. Цифровая перрон РФС призвана обеспечить работу экосистемы российского футбола и ее переход на электронную форму взаимодействия между субъектами. Разработка подобный экосистемы ведется в рамках (рамка (из нем) проекта «Стратегия 2030» по развитию футбола (командный вид спорта, в котором целью является забить мяч в ворота соперника ногами или другими частями тела (кроме рук) большее количество раз, чем команда соперника) в России. Платформа создается на базе реляционного хранилища на MySQL и Hadoop под управлением Spark для труды с неструктурированными данными. Остальная часть инфраструктуры, отвечающая за систему запросов и подготовку отчетов, формируется на Python. Перрон объединит сведения об игроках, тренерах, судьях, инспекторах, всех спортивных специалистах, возьмет на себя подсчет всех существующих в краю спортивных объектов, обеспечит взаимодействие с партнерами РФС. Цифровая платформа (может означать: Железнодорожная платформа: Платформа — возвышенная площадка, помост для посадки пассажиров в вагоны, для нагрузки и выгрузки товаров) позволит футбольным школам и клубам по всей краю организовать свой тренировочный процесс. Главная проблема обеспечения качества данных — неполнота их источников, отметил Линник. Сбор референсных этих требует серьезной организационной работы. На текущий момент сформирована база данных по профессиональным игрокам, начинается формирование базы по любительскому футболу.

3d-evolution.ru - Эволюция 3D стали неотъемлемой частью нашей повседневной жизни.
Мы смотрим фильмы, играем в компьютерные игры, пользуемся ими в работе и учебе.
Однако мало кто задумывается о том, что 3D-технология имеет и другую, не менее важную сторону.
Понравилась статья? Поделиться с друзьями:
3d-evolution.ru
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: