На недавнем мероприятии FinTech North, у меня была возможность выступить на панельной дискуссии и погрузиться в одну из моих любимых тем: ценность умных данных.
Что это такое? Данные сами по себе не умные или нет — но то, как вы их используете, может быть. Это становится стратегическим деловым активом только после того, как вы построите правильные процессы и конвейеры вокруг данных.
Первая часть любого процесса, связанного с данными, — это понимание их. Очистка исходных данных обеспечивает согласованность и точность, что облегчает сравнение из разных источников для извлечения значимых выводов. Предприятия затем используют эти данные для различных отчетов, как для внутреннего использования, так и для выполнения внешних регуляторных требований.
Когда правильные процессы качества данных на месте, процесс сверки и отчетности становится более эффективным. Без них команды будут очень заняты времязатратной (и избежать) работой с данными по течению времени. Предприятия должны стремиться к возможности стандартизировать данные из множества разных источников на общий язык.
У нас в Kani Payments данные поступают из различных источников, обычно от процессоров, которые работают с выпускающими карты Mastercard или Visa. Их транзакционные данные — это то, что мы извлекаем в нашу систему. Обычно платежные шлюзы предоставляют данные в своем собственном формате для использования своими клиентами, которые и обращаются к нам.
Мы берем данные из нескольких файлов, предоставленных в различных форматах, и импортируем их в базу данных, которая структурирует данные. Дополнительный слой стандартизации позволяет нам использовать все доступные транзакционные данные для отчетности. Создание доступной через удобные панели инструментов предоставляет нашим клиентам стандартизированное представление, чтобы они могли запрашивать все свои данные в одном месте.
Получение такого всестороннего обзора должно быть основной целью вашей стратегии данных, особенно если вы работаете с несколькими платежными процессорами. Один процессор может дать вам файл CSV, другой — файл XML, а третий — PDF или текстовый файл. Внутренние финансовые службы обычно не так технологически грамотны — они не понимают эти различные форматы файлов или как открыть и получить информацию, которую они действительно хотят. Правильное решение делает все это за вас.
Прочные процессы стандартизации данных помогают ускорить расследования и устранить аномалии в сверках. С таким большим количеством разных файлов и наборов данных, участвующих в различных источниках, часто бывает, что некоторые поля данных отсутствуют. Или, может быть, процессор генерирует названия столбцов данных определенным образом (например, дата транзакции, валюта и сумма транзакции), тогда как другой может использовать случайный код для того же столбца. Эти различия создают проблемы с комплектацией.
Если клиенты попытаются исследовать эти различия, им придется просматривать спецификационный документ каждого процессора и выяснять каждый столбец в каждом наборе данных, чтобы найти то, что они ищут. Расширенные практики стандартизации разрешают это, анализируя определенные элементы транзакции, такие как даты, суммы или как транзакция была авторизована.
Вся наша работа в платежной индустрии связана с предоставлением решений нашим клиентам для получения максимальной ценности из их данных, и мы рады, что наша работа здесь продвигается в другие области. Мы начали отображать данные клиентов с широкими экономическими данными, такими как ВВП или другие макроэкономические данные, чтобы предоставлять более интеллектуальные идеи и проводить сравнение с широкой отраслью.
Внутри наша проводим очень интересные анализы трендов по странам и тенденций в платежах. Мы позволяем клиентам видеть это на визуальном уровне. Если клиенты хотят войти на новый рынок, мы можем посмотреть на их данные, проанализировать региональные тенденции из других источников данных и определить, что лучше для них.
Глядя в будущее, мы планируем применить различные статистические модели или модели машинного обучения для более точного прогнозирования. У вас может быть набор расходов по держателю карты в определенный момент времени, но как это будет выглядеть через шесть месяцев? Это следующий шаг для получения более полезной информации из ваших данных и использования ее для принятия управленческих решений.
Меня часто спрашивают, каким будет будущее науки о данных. Одним словом — оживленность!
Наука о данных будет продолжать привлекать все больше найма просто потому, что есть так много потенциала для изучения ее. Она станет все более распространенной, поскольку люди становятся все более внимательными к таким методам, как машинное обучение, особенно учитывая усвоение ChatGPT и других крупных языковых моделей. Чем больше людей заинтересовано в этих областях, тем больше исследований, разработок и интереса к потенциальным приложениям.
Источник: TechRadar