Шпаргалка
Технологии и данные — все темы на одной странице
Цифровая трансформация и AI
Что такое цифровая трансформация, роль AI в бизнесе, стратегия цифровой трансформации
Что такое цифровая трансформация → Движущие силы цифровой трансформации → Примеры цифровой трансформации → Препятствия цифровой трансформации → Практическое задание
Цифровая трансформация — это фундаментальное изменение того, как организация создаёт ценность, используя цифровые технологии. Это не автоматизация существующих процессов (это «оцифровка», digitization), не их перевод в электронный формат (digitalization) — это переосмысление бизнес-модели в цифро...
Три уровня трансформации: 1. Digitization — перевод аналоговой информации в цифровую (бумажный архив → PDF) 2. Digitalization — использование цифровых технологий для улучшения существующих процессов (электронный документооборот) 3. Digital Transformation — создание принципиально новых ценностей и...
Изменение ожиданий клиентов: Amazon, Netflix, Uber переопределили клиентский опыт. Теперь клиенты ожидают мгновенного, персонализированного, 24/7 сервиса от всех компаний, в том числе от банка, страховщика, ритейлера.
Давление конкурентов: каждая отрасль испытывает угрозу от «нативных» цифровых игроков (digital natives), не обременённых устаревшей инфраструктурой.
Что такое современный AI → Бизнес-применения AI → Ограничения AI → Практическое задание
Современный AI — не «думающий робот» из фантастики, а набор статистических методов, позволяющих компьютерам обнаруживать паттерны в данных и делать прогнозы.
Машинное обучение (ML): алгоритмы, которые учатся на данных без явного программирования. Supervised learning (обучение с учителем), unsupervised learning, reinforcement learning.
Глубокое обучение (Deep Learning): нейронные сети с множеством слоёв. Революция в компьютерном зрении (распознавание объектов), распознавании речи, обработке языка.
Генеративный AI (GenAI): модели, создающие новый контент — текст (GPT-4, Claude), изображения (Midjourney, DALL-E), код (GitHub Copilot), видео (Sora).
Что такое LLM → Корпоративное применение LLM → Риски и ограничения в бизнесе → Практическое задание
Large Language Models (LLM) — крупные нейронные сети, обученные на огромных объёмах текста. GPT-4 (OpenAI), Claude (Anthropic), Gemini (Google), Llama (Meta) — основные модели на рынке.
Способности LLM: генерация текста (на уровне человека); ответы на вопросы; анализ и обобщение документов; перевод; написание кода; творческое мышление.
Почему LLM — прорыв: до LLM AI хорошо работал с чёткими данными (изображения, числа). LLM открыли AI к неструктурированному тексту — 80% корпоративной информации неструктурировано.
Генерация контента: маркетинговые тексты, описания продуктов, отчёты, шаблонные документы. McKinsey оценивает: AI автоматизирует 20-40% офисных задач.
Диагностика цифровой зрелости → Типичные ошибки цифровой трансформации → Фреймворк «Начни с ценности» → Архитектура цифровой платформы → Практическое задание
Прежде чем строить стратегию — оценить текущее состояние. Модели зрелости: MIT CISR Digital Maturity Model (4 стадии: beginner → fashionista → conservative → digerati), McKinsey Digital Quotient.
Ключевые измерения: цифровые способности (технологии, данные, процессы); организационная готовность (культура, таланты, лидерство).
«Технология ради технологии»: «Внедрим блокчейн» без понимания, какую проблему он решает.
«Слишком много проектов сразу»: параллельное ведение 30 инициатив → ни одна не завершается.
Что такое облако → Три модели облачных услуг → Ключевые облачные провайдеры → Облако и безопасность данных → Практическое задание
Облачные вычисления — предоставление IT-ресурсов (серверы, хранилища, приложения) по сети (как правило, интернет) по модели оплаты за использование (pay-as-you-go).
До облака: компания покупала собственные серверы, обслуживала их, несла постоянные затраты. С облаком: ресурсы — как электричество, платишь за потреблённое.
IaaS (Infrastructure as a Service): аренда виртуальных серверов, хранилища, сети. Контроль над ОС и выше. AWS EC2, Azure VMs, Google Compute Engine. Для кого: IT-команды, разработчики.
PaaS (Platform as a Service): платформа для разработки и развёртывания приложений без управления инфраструктурой. AWS Elastic Beanstalk, Google App Engine, Heroku. Для кого: разработчики, которые не хотят управлять серверами.
Данные и аналитика для бизнеса
Data-driven решения, бизнес-аналитика, DataOps, BI-инструменты, Machine Learning в продуктах
Что значит принимать решения на основе данных → Ключевые метрики и KPI → Data Infrastructure → Практическое задание
Data-driven — культура и практика принятия решений на основе анализа данных, а не интуиции или опыта. Amazon: Bezos ввёл «culture of metrics» — каждое решение, которое можно измерить, должно быть измерено.
Ступени data-аналитики: 1. Descriptive (описательная): что произошло? (Отчёты, дашборды, KPI) 2. Diagnostic (диагностическая): почему это произошло? (Root cause analysis, дрилл-даун) 3. Predictive (предиктивная): что произойдёт? (Прогнозные модели, ML) 4. Prescriptive (предписывающая): что нам сд...
North Star Metric: одна ключевая метрика, отражающая ценность для клиентов. Airbnb — «количество ночей бронирования». Facebook — «daily active users». Все остальные метрики подчинены ей.
Воронка (Funnel): для e-commerce: Impressions → Clicks → Add to Cart → Purchase → Repeat. Конверсия на каждом шаге — ключ к оптимизации.
Зачем визуализировать данные → Ведущие BI-платформы → Принципы хорошей визуализации → Практическое задание
Человеческий мозг обрабатывает визуальную информацию в 60 000 раз быстрее, чем текст. Хорошая визуализация превращает таблицы в инсайты. Плохая — вводит в заблуждение.
Power BI (Microsoft): наиболее распространён в корпоративном сегменте. Интеграция с Excel, Office 365, Azure. Цена — $10/пользователь/месяц (Pro). Богатые коннекторы к различным источникам данных.
Tableau (Salesforce): сильнейший инструмент визуализации. Интерактивные дашборды, drag-and-drop. Дороже Power BI. Популярен среди аналитиков.
Looker (Google): modern BI на основе LookML (язык моделирования). Логика метрик хранится в коде, а не в отчётах — единая версия правды. Интеграция с BigQuery.
GDPR: что должен знать бизнес → Этика AI: от принципов к практике → Практическое задание
- •Законность, справедливость, прозрачность
- •Ограничение цели (данные только для заявленных целей)
- •Минимизация данных (собирай только необходимое)
- •Ограничение хранения (не храни бессрочно)
- •Целостность и конфиденциальность
- •Подотчётность
General Data Protection Regulation (ЕС, 2018) — самый влиятельный закон о персональных данных. Применяется к любой компании, обрабатывающей данные жителей ЕС, независимо от юрисдикции компании.
Права субъектов данных: право на доступ; право на исправление; право на удаление («право быть забытым»); право на переносимость; право не подвергаться автоматизированным решениям.
Штрафы: до €20 млн или 4% глобального оборота (что больше). Meta — штраф €1,2 млрд (2023) за незаконную передачу данных в США.
Пять принципов этичного AI (ОЭСР): человеческие ценности и права; прозрачность и объяснимость; надёжность; подотчётность; инклюзивность.
Жизненный цикл ML-проекта → Feature Engineering: искусство создания признаков → Когда НЕ нужен ML → Практическое задание
1. Постановка задачи: ML-задача должна соответствовать бизнес-задаче. «Уменьшить отток клиентов» → «предсказать вероятность оттока в следующие 30 дней» (классификация).
2. Сбор и подготовка данных: 80% времени ML-проекта. Чистка данных, обработка пропусков, feature engineering (создание признаков из сырых данных).
3. Выбор модели и обучение: простые модели (логистическая регрессия, дерево решений) → ансамбли (Random Forest, XGBoost) → нейронные сети. Правило: начинай с простого.
4. Оценка модели: метрики зависят от задачи: Accuracy, Precision, Recall, F1 (классификация); RMSE, MAE (регрессия); AUC-ROC (вероятностная классификация).
Что такое API → API как бизнес-модель → Интеграция корпоративных систем → Практическое задание
API (Application Programming Interface) — интерфейс, позволяющий приложениям общаться друг с другом. Как розетка: стандартный интерфейс для подключения разных устройств.
REST API — наиболее распространённый стандарт. Работает через HTTP: GET (получить данные), POST (создать), PUT/PATCH (обновить), DELETE (удалить). Данные в JSON-формате.
Пример: Uber не строит собственные карты. Он использует Google Maps API. Stripe не строит собственную платёжную инфраструктуру — используют API банков и платёжных сетей.
Open Banking: банки по регуляторным требованиям (PSD2 в ЕС) открыли API для финтехов. Это позволило создать агрегаторы счетов, PFM-приложения, платёжные инициаторы без собственной банковской лицензии.
Fintech и цифровые финансы
Финтех-индустрия, необанки, платёжные системы, блокчейн, криптовалюты, RegTech
Что такое финтех → Волны финтех-инноваций → Необанки: переопределение банкинга → Embedded Finance → Практическое задание
Финтех (Financial Technology) — компании, использующие технологии для предоставления финансовых услуг. Широкое определение охватывает: платёжные сервисы, кредитование, инвестиции, страхование (insurtech), управление капиталом (wealthtech), регуляторные технологии (regtech).
Первая волна (2008-2015): Post-crisis — кризис доверия к банкам открыл двери финтехам. Появились: Stripe (2010), Robinhood (2013), Betterment (2010), TransferWise (Wise, 2011).
Вторая волна (2015-2020): необанки (Revolut, N26, Monzo), P2P-кредитование, insurtech. Банковский опыт перестраивается от «отделение» к «мобильное приложение».
Третья волна (2020-): embedded finance, BaaS (Banking as a Service), DeFi (Decentralized Finance), AI-first финансы.
Как работает блокчейн → Bitcoin: цифровое золото → Ethereum и смарт-контракты → DeFi: финансы без посредников → Практическое задание
Блокчейн — распределённый реестр (ledger), записи в котором: неизменяемы (immutable), прозрачны (transparent), децентрализованы (decentralized), защищены криптографически.
Механизм: транзакции группируются в блоки → каждый блок содержит хэш предыдущего → изменение любого блока меняет все последующие → вся сеть верифицирует → невозможно подделать.
Proof of Work vs Proof of Stake: Bitcoin использует PoW (майнинг) — огромный расход энергии, медленно. Ethereum перешёл на PoS (стейкинг) — 99% снижение потребления энергии.
Bitcoin (2009, Сатоши Накамото) — первая децентрализованная криптовалюта. Ограниченная эмиссия (21 млн монет) → аргумент как «цифровое золото» (hedge против инфляции). Институциональные инвесторы: Spot Bitcoin ETF (BlackRock, Fidelity, одобрены SEC в январе 2024). MicroStrategy — крупнейший корпо...
Инфраструктура платежей → Инновации в платежах → Трансграничные платежи → Практическое задание
Традиционный платёж картой: Покупатель → Эквайер (банк магазина) → Платёжная система (Visa/Mastercard) → Эмитент (банк покупателя) → Обратно. Этот процесс занимает доли секунды, но расчёты — T+2 дня.
Участники: Visa/Mastercard — «рельсы» (не держат деньги, только обрабатывают информацию); банки-эмитенты (выпускают карты); банки-эквайеры (принимают платежи); процессоры (технический слой).
Real-Time Payments: мгновенные межбанковские переводы. Система Банка России (СБП), UPI в Индии (8+ млрд транзакций/месяц), FedNow в США (2023), SCT Inst в ЕС.
Open Banking Payments: платёж напрямую со счёта покупателя без карты — через API банка (A2A payments). Дешевле для мерчанта, нет interchange fee.
Что такое RegTech → Ключевые направления RegTech → Практический пример: цифровой онбординг клиента → Практическое задание
RegTech (Regulatory Technology) — технологии для выполнения регуляторных требований эффективнее и дешевле. Нарастающее регуляторное бремя (AML, GDPR, Basel III) создаёт огромный спрос.
Глобальные расходы на комплаенс: $270 млрд в год (2022). Крупные банки тратят 15-20% операционных расходов на комплаенс.
KYC/AML автоматизация: верификация личности (eKYC) через AI (распознавание документов, liveness check, биометрия). Провайдеры: Jumio, Onfido, Sumsub. Скорость KYC: 30 минут → 2 минуты при автоматизации.
Transaction Monitoring: ML-модели выявляют подозрительные транзакции (паттерны мошенничества, структурирование, отмывание). Снижение false positives (ложных срабатываний) — ключевая задача.
Что такое wealthtech → Роботизированные советники (Robo-Advisors) → Цифровая платформа для Family Office → Альтернативные инвестиции в цифровую эпоху → Практическое задание
Wealthtech — применение технологий в управлении капиталом (wealth management). Традиционно — закрытая элитная отрасль. Технологии демократизируют доступ к инвестициям.
Robo-advisor: автоматизированная платформа, которая строит и управляет диверсифицированным портфелем на основе риск-профиля клиента.
Модель: клиент отвечает на вопросник → алгоритм определяет портфель (обычно ETF) → автоматическая ребалансировка → всё это дёшево ($0 или 0,25%/год).
Крупнейшие: Betterment ($35 млрд AUM), Wealthfront ($27 млрд). В ОАЭ: Sarwa, StashAway.
Кибербезопасность и риски
Кибербезопасность для бизнеса, основные угрозы, защита данных, управление киберрисками
Почему кибербезопасность — стратегический вопрос → Ключевые типы угроз → Основные принципы защиты → Практическое задание
Средняя стоимость утечки данных (IBM 2023): $4,45 млн. Помимо прямых потерь — репутационный ущерб, штрафы регуляторов (GDPR), потеря клиентов. Крупнейшие утечки: Equifax (147 млн клиентов, $700 млн штраф), Sony Pictures (2014, $100 млн ущерб).
Изменение ландшафта угроз: атаки больше не только против крупных корпораций. Ransomware (программы-вымогатели) атакуют больницы, малый бизнес, муниципалитеты.
Фишинг (Phishing): мошеннические письма/сообщения, имитирующие легитимные организации. 91% кибератак начинаются с фишинга. Spear phishing — целенаправленный фишинг против конкретного человека.
Ransomware: программа шифрует данные, требует выкуп. Colonial Pipeline (2021): $4,4 млн выкупа, паника с бензином на восточном побережье США.
Кибербезопасность как управление рисками → NIST Cybersecurity Framework → ISO 27001 → Страхование киберрисков → Практическое задание
Абсолютной безопасности нет. Задача — управлять рисками: снизить вероятность атаки, минимизировать ущерб при успешной атаке, обеспечить восстановление.
Формула: Cyber Risk = Threat (угрозы) × Vulnerability (уязвимости) × Asset Value (ценность актива).
Protect: контроли для снижения рисков. MFA, шифрование, обучение персонала, управление доступом.
Detect: мониторинг для выявления инцидентов. SIEM (Security Information and Event Management) — агрегация и анализ логов.
Privacy by Design → Технические меры защиты данных → Identity & Access Management (IAM) → Практическое задание
Принцип «конфиденциальность по умолчанию»: защита данных должна быть встроена в систему с самого начала, а не добавлена потом. Семь принципов Ann Cavoukian: проактивность; конфиденциальность по умолчанию; встроена в дизайн; полная функциональность; сквозная безопасность; видимость и прозрачность;...
Шифрование: at-rest (данные в хранилище) и in-transit (данные в передаче). AES-256 для хранения, TLS 1.3 для передачи. «Золотое правило»: шифруй всё, что можно.
Токенизация: замена чувствительных данных (номер карты) на случайный токен. Даже при утечке — токен бесполезен без ключа.
Анонимизация и псевдонимизация: обратимое (псевдонимизация) и необратимое (анонимизация) удаление идентифицирующих признаков. GDPR различает: анонимные данные не регулируются, псевдонимные — регулируются.
Модель разделения ответственности в облаке → Ключевые риски облачной безопасности → Безопасность при удалённой работе → Практическое задание
В облаке безопасность — совместная ответственность: провайдер отвечает за безопасность «облака» (физические датацентры, гипервизоры, сетевая инфраструктура). Клиент отвечает за безопасность «в облаке»: конфигурация сервисов, данные, доступ, приложения.
Главная ошибка: думать, что AWS/Azure «всё делают за нас». Крупнейшие утечки из облака — результат неправильной конфигурации клиентом (например, открытый S3 bucket).
Misconfiguration: случайно открытый публичный доступ к данным. Capital One (2019): $150 млн штраф из-за неправильной конфигурации AWS IAM.
Чрезмерные привилегии: каждый сервис и пользователь должны иметь минимально необходимые права (IAM policies).
Когда произойдёт атака, а не если → Жизненный цикл реагирования на инциденты (NIST SP 800-61) → Ransomware: платить или не платить? → Практическое задание
Не «если» случится атака, а «когда». Понимание этого меняет подход: от «предотвратить любой ценой» к «предотвратить максимально + подготовиться к реагированию».
1. Подготовка: CIRT (Computer Incident Response Team); план реагирования; playbooks для типовых инцидентов; коммуникационные цепочки; контакты страховщика, юриста, PR.
2. Обнаружение и анализ: источники: SIEM алёрты, жалобы пользователей, внешние уведомления (партнёры, регуляторы). Оценка: масштаб, тип, серьёзность.
3. Сдерживание: быстрое (изолировать заражённые системы — отключить от сети) и долгосрочное (определить root cause, устранить вектор атаки).
PropTech и недвижимость
Технологии в недвижимости, умные здания, цифровые платформы, токенизация, управление активами
Что такое PropTech → Волны PropTech → Ключевые сегменты PropTech → PropTech в ОАЭ → Практическое задание
PropTech (Property Technology) — применение технологий для трансформации рынка недвижимости: поиск, покупка, управление, финансирование объектов.
PropTech 1.0 (1990-2008): перенос объявлений в интернет. Zillow (2006), Rightmove, ЦИАН. Оцифровка, а не трансформация.
PropTech 2.0 (2008-2020): платформы, маркетплейсы, sharing economy. Airbnb — переопределил краткосрочную аренду; WeWork — офисы по подписке; Opendoor — iBuying (мгновенная покупка домов по алгоритму).
Инвестиции в недвижимость: токенизация (дробные доли); краудфандинг (Fundrise, RealtyMogul); данные и аналитика (CoStar, MSCI Real Assets).
Что такое умное здание → IoT в недвижимости: датчики и данные → ESG и умные здания → Цифровой двойник здания (Digital Twin) → Практическое задание
Умное здание (Smart Building) — здание, использующее IoT-датчики и автоматизированные системы для оптимизации: энергопотребления, комфорта, безопасности, операционной эффективности.
Компоненты умного здания: BMS (Building Management System) — сердце умного здания, интегрирует все системы; HVAC (отопление, вентиляция, кондиционирование) — крупнейший потребитель энергии; освещение (автоматическое по присутствию и дневному свету); доступ и безопасность; мониторинг лифтов.
IoT-датчики собирают данные: датчики присутствия (occupied/vacant — оптимизация HVAC и освещения); датчики CO2 и качества воздуха; счётчики потребления (электроэнергия, вода, тепло); датчики температуры и влажности; счётчики посетителей.
Данные → аналитика → действия. Пример: датчики CO2 показывают, что конференц-зал занят постоянно, хотя по брони — только 3 часа. Оптимизация: убрать требование бронирования, управлять HVAC по факту присутствия.
Что такое токенизация недвижимости → Преимущества для инвесторов → Регуляторный контекст → Практические проекты → Практическое задание
Токенизация — представление права собственности на реальный актив (недвижимость) в форме цифровых токенов на блокчейне. Каждый токен = доля в активе. Инвестор покупает токены, получает долю в арендном доходе и приросте стоимости.
Доступность: вместо $1 млн для покупки квартиры — можно инвестировать $1 000. Демократизация инвестиций в недвижимость.
Ликвидность: токены торгуются на вторичных рынках (vs недвижимость — неликвидный актив, продажа занимает месяцы). Это ключевое преимущество.
Прозрачность: все транзакции записаны в блокчейне, автоматическое распределение дохода через смарт-контракты.
AI для оценки недвижимости → Dynamic Pricing для аренды → Предиктивное обслуживание (Predictive Maintenance) → Практическое задание
Традиционная оценка: оценщик анализирует сопоставимые сделки, применяет поправки, выдаёт субъективное мнение. Занимает дни, стоит $500-5000.
AVM (Automated Valuation Model): алгоритмы машинного обучения, анализирующие тысячи факторов — локация, площадь, этаж, транспортная доступность, близость инфраструктуры, исторические сделки, рыночные тренды.
Точность AVM: для стандартных объектов — в пределах 5-10%. Для уникальных (элитная, коммерческая) — ниже. Zillow Zestimate — самый известный AVM, но имел скандальный провал (iBuying программа).
По аналогии с hotel Revenue Management: цена аренды меняется в зависимости от спроса, сезона, заполняемости рынка, характеристик объекта.
VR/AR в недвижимости сегодня → Цифровая недвижимость в метавселенной → Digital Twin города → Практическое задание
Virtual Reality (VR) позволяет виртуально посещать объекты. Применения: (1) Virtual Tours — покупатель/арендатор из другой страны «ходит» по квартире в VR-шлеме; (2) Staging виртуальный — показ незастроенного пространства с мебелью; (3) Строительство — виртуальный обход ещё незапущенных зданий на...
Бизнес-эффект: Sotheby's International Realty: покупатели, использующие VR-туры, на 40% чаще делают предложение без физического осмотра.
AR (Augmented Reality) позволяет «наложить» цифровую информацию на реальный мир. Приложение для покупателя: направляешь телефон на здание → видишь данные о жильцах, ценах сделок, характеристиках.
Метавселенные (Decentraland, The Sandbox, Horizon Worlds) — цифровые миры, где можно покупать «земельные участки» в форме NFT.