[AI] Библиотека программиста - Сюй Алекс, Аминиан Али - System Design. Машинное обучение. Подготовка к сложному интервью [2024, PDF, RUS]

Страницы:  1
Ответить
 

tsurijin

Стаж: 4 года 7 месяцев

Сообщений: 2725


tsurijin · 18-Янв-24 15:13 (1 год 5 месяцев назад, ред. 18-Янв-24 15:33)

System Design. Машинное обучение. Подготовка к сложному интервью
Год издания: 2024
Автор: Сюй Алекс, Аминиан Али
Переводчик: Матвеев Е.
Издательство: Питер
ISBN: 978-5-4461-2130-4
Серия: Библиотека программиста
Язык: Русский
Формат: PDF
Качество: Издательский макет или текст (eBook)
Интерактивное оглавление: Да
Количество страниц: 320
Описание: Собеседования по проектированию системы машинного обучения — самые сложные из всех вопросов технического собеседования. Эта книга предоставляет надежную стратегию и базу знаний для решения широкого круга вопросов проектирования систем машинного обучения. Пошаговый подход формирует основу для решения любого вопроса проектирования, используя множество реальных примеров.
Эта книга поможет всем, кто интересуется проектированием систем машинного обучения, будь то новички или опытные инженеры. Если вам нужно подготовиться к собеседованию по данной теме, эта книга создана специально для вас.
Примеры страниц
Оглавление
Предисловие........................................................................................................................14
Что такое собеседование по проектированию систем МО (ML System Design interview)...............14
Почему это важно.................................................................................................................14
Для кого эта книга................................................................................................................15
Чего нет в книге...................................................................................................................15
Дополнительные ресурсы......................................................................................................15
Благодарности.....................................................................................................................16
От издательства...................................................................................................................18
Глава 1. Введение и общие сведения.....................................................................................19
Прояснение требований........................................................................................................20
Формулировка проблемы в виде задачи МО............................................................................21
Определение цели МО..........................................................................................................22
Определение входных и выходных данных системы...............................................................22
Выбор подходящей категории МО.........................................................................................24
Темы для обсуждения..........................................................................................................25
Подготовка данных..............................................................................................................25
Инженерия данных..............................................................................................................26
Типы данных.......................................................................................................................27
Конструирование признаков.................................................................................................29
Операции конструирования признаков..................................................................................30
Темы для обсуждения...........................................................................................................34
Разработка модели...............................................................................................................34
Выбор модели......................................................................................................................34
Обучение модели.................................................................................................................36
Темы для обсуждения...........................................................................................................40
Оценка................................................................................................................................41
Автономная (offline) оценка...................................................................................................41
Оперативная (online) оценка.................................................................................................42
Темы для обсуждения...........................................................................................................43
Развертывание и эксплуатация..............................................................................................43
Развертывание в облаке или на устройстве............................................................................43
Сжатие модели.....................................................................................................................44
Тестирование при эксплуатации............................................................................................44
Пайплайн предсказаний.......................................................................................................46
Темы для обсуждения...........................................................................................................48
Мониторинг..........................................................................................................................48
Почему в действующей системе происходят сбои....................................................................49
Какие показатели нужно отслеживать....................................................................................50
Инфраструктура...................................................................................................................50
Итоги...................................................................................................................................51
Ссылки................................................................................................................................51
Глава 2. Система визуального поиска....................................................................................54
Прояснение требований........................................................................................................54
Формулировка проблемы в виде задачи МО............................................................................56
Определение цели МО...........................................................................................................56
Определение входных и выходных данных системы.................................................................56
Выбор подходящей категории МО...........................................................................................56
Подготовка данных................................................................................................................58
Инженерия данных................................................................................................................58
Конструирование признаков...................................................................................................60
Разработка модели.................................................................................................................60
Выбор модели........................................................................................................................60
Обучение модели...................................................................................................................61
Построение датасета..............................................................................................................62
Выбор функции потерь..........................................................................................................64
Оценка.................................................................................................................................66
Автономные метрики.............................................................................................................66
Оперативные метрики...........................................................................................................72
Эксплуатация.......................................................................................................................72
Предсказательный пайплайн.................................................................................................73
Пайплайн индексации...........................................................................................................74
Эффективность алгоритмов поиска ближайшего соседа (NN)...................................................75
Какой алгоритм использовать?..............................................................................................77
Другие темы для обсуждения................................................................................................78
Итоги..................................................................................................................................79
Ссылки................................................................................................................................80
Глава 3. Система размытия в Google Street View......................................................................81
Прояснение требований.........................................................................................................81
Формулировка проблемы в виде задачи МО.............................................................................82
Определение цели МО...........................................................................................................82
Определение входных и выходных данных системы.................................................................83
Выбор подходящей категории МО...........................................................................................83
Двухступенчатые сети............................................................................................................83
Одноступенчатые сети............................................................................................................84
Сравнение одноступенчатых и двухступенчатых сетей..............................................................84
Подготовка данных................................................................................................................85
Инженерия данных................................................................................................................85
Конструирование признаков...................................................................................................86
Разработка модели................................................................................................................88
Выбор модели.......................................................................................................................88
Обучение модели...................................................................................................................90
Оценка.................................................................................................................................91
Автономные метрики.............................................................................................................93
Оперативные метрики...........................................................................................................95
Эксплуатация.......................................................................................................................95
Перекрытие ограничительных прямоугольников......................................................................95
Проектирование системы МО.................................................................................................96
Пайплайн пакетных предсказаний.........................................................................................96
Другие темы для обсуждения................................................................................................98
Итоги..................................................................................................................................99
Ссылки...............................................................................................................................100
Глава 4. Поиск видео на YouTube..........................................................................................101
Прояснение требований.......................................................................................................101
Формулировка проблемы в виде задачи МО...........................................................................102
Определение цели МО.........................................................................................................102
Определение входных и выходных данных системы...............................................................102
Выбор категории МО............................................................................................................103
Подготовка данных..............................................................................................................105
Инженерия данных..............................................................................................................105
Конструирование признаков.................................................................................................106
Разработка модели..............................................................................................................110
Выбор модели.....................................................................................................................110
Обучение модели................................................................................................................116
Оценка..............................................................................................................................117
Автономные метрики...........................................................................................................117
Оперативные метрики.........................................................................................................118
Эксплуатация....................................................................................................................119
Предсказательный пайплайн..............................................................................................120
Пайплайн индексации видео...............................................................................................121
Пайплайн индексации текста..............................................................................................121
Другие темы для обсуждения..............................................................................................121
Итоги................................................................................................................................123
Ссылки.............................................................................................................................124
Глава 5. Обнаружение вредоносного контента.....................................................................125
Прояснение требований......................................................................................................126
Формулировка проблемы в виде задачи МО..........................................................................127
Определение цели МО.........................................................................................................127
Определение входных и выходных данных системы..............................................................127
Выбор категории МО...........................................................................................................131
Подготовка данных.............................................................................................................137
Инженерия данных.............................................................................................................137
Конструирование признаков...............................................................................................138
Разработка модели.............................................................................................................143
Выбор модели....................................................................................................................143
Обучение модели...............................................................................................................144
Оценка..............................................................................................................................146
Автономные метрики...........................................................................................................146
Оперативные метрики.........................................................................................................147
Эксплуатация.....................................................................................................................148
Сервис обнаружения вредоносного контента.........................................................................148
Сервис обработки нарушений...............................................................................................148
Сервис понижения приоритета..............................................................................................148
Другие темы для обсуждения................................................................................................149
Итоги..................................................................................................................................150
Ссылки...............................................................................................................................151
Глава 6. Система рекомендации видео..................................................................................153
Прояснение требований.......................................................................................................154
Формулировка проблемы в виде задачи МО...........................................................................155
Определение цели МО.........................................................................................................155
Определение входных и выходных данных системы...............................................................156
Выбор категории МО............................................................................................................156
Подготовка данных..............................................................................................................161
Инженерия данных..............................................................................................................161
Конструирование признаков................................................................................................163
Разработка модели..............................................................................................................168
Матричная факторизация....................................................................................................168
Двухбашенная нейронная сеть.............................................................................................175
Работа двухбашенной нейронной сети..................................................................................177
Матричная факторизация или двухбашенная нейронная сеть?................................................179
Оценка...............................................................................................................................179
Автономные метрики...........................................................................................................179
Оперативные метрики.........................................................................................................180
Эксплуатация.....................................................................................................................181
Генерация кандидатов........................................................................................................182
Скоринг.............................................................................................................................184
Повторное ранжирование...................................................................................................184
Трудности при разработке систем рекомендации видео.........................................................185
Другие темы для обсуждения..............................................................................................186
Итоги.................................................................................................................................187
Ссылки...............................................................................................................................188
Глава 7. Система рекомендации событий...............................................................................189
Прояснение требований.......................................................................................................190
Формулировка проблемы в виде задачи МО...........................................................................191
Определение цели МО.........................................................................................................191
Определение входных и выходных данных системы...............................................................191
Выбор подходящей категории МО.........................................................................................192
Списочные методы LTR........................................................................................................193
Подготовка данных.............................................................................................................194
Инженерия данных..............................................................................................................194
Конструирование признаков.................................................................................................196
Разработка модели...............................................................................................................204
Выбор модели......................................................................................................................204
Обучение модели.................................................................................................................212
Оценка...............................................................................................................................214
Автономные метрики...........................................................................................................214
Оперативные метрики.........................................................................................................214
Эксплуатация.....................................................................................................................215
Пайплайн оперативного обучения........................................................................................215
Предсказательный пайплайн................................................................................................216
Другие темы для обсуждения...............................................................................................218
Итоги.................................................................................................................................219
Ссылки...............................................................................................................................220
Глава 8. Предсказание кликов по рекламе на социальных платформах....................................221
Введение............................................................................................................................221
Прояснение требований.......................................................................................................222
Формулировка проблемы в виде задачи МО...........................................................................223
Определение цели МО.........................................................................................................223
Определение входных и выходных данных системы...............................................................223
Выбор категории МО............................................................................................................224
Подготовка данных..............................................................................................................225
Инженерия данных..............................................................................................................225
Конструирование признаков.................................................................................................226
Признаки пользователя........................................................................................................228
Разработка модели...............................................................................................................230
Выбор модели......................................................................................................................230
Обучение модели.................................................................................................................241
Оценка...............................................................................................................................242
Автономные метрики...........................................................................................................242
Оперативные метрики.........................................................................................................244
Эксплуатация.....................................................................................................................245
Пайплайн подготовки данных..............................................................................................246
Пайплайн непрерывного обучения.......................................................................................247
Предсказательный пайплайн...............................................................................................247
Другие темы для обсуждения...............................................................................................248
Итоги.................................................................................................................................249
Ссылки...............................................................................................................................250
Глава 9. Похожие объекты на платформах краткосрочной аренды жилья.................................251
Прояснение требований.......................................................................................................252
Формулировка проблемы в виде задачи МО...........................................................................253
Определение цели МО.........................................................................................................253
Определение входных и выходных данных системы...............................................................253
Выбор категории МО............................................................................................................254
Подготовка данных..............................................................................................................255
Инженерия данных..............................................................................................................255
Конструирование признаков.................................................................................................256
Разработка модели...............................................................................................................257
Выбор модели......................................................................................................................257
Обучение модели.................................................................................................................257
Построение датасета............................................................................................................258
Оценка...............................................................................................................................262
Автономные метрики...........................................................................................................262
Оперативные метрики.........................................................................................................264
Эксплуатация.....................................................................................................................264
Обучающий пайплайн.........................................................................................................264
Индексирующий пайплайн...................................................................................................265
Предсказательный пайплайн...............................................................................................266
Другие темы для обсуждения...............................................................................................267
Итоги.................................................................................................................................268
Ссылки...............................................................................................................................269
Глава 10. Персонализированная лента новостей....................................................................270
Введение............................................................................................................................270
Прояснение требований.......................................................................................................271
Формулировка проблемы в виде задачи МО...........................................................................272
Определение цели МО.........................................................................................................272
Определение входных и выходных данных системы...............................................................274
Выбор категории МО............................................................................................................274
Подготовка данных..............................................................................................................275
Инженерия данных..............................................................................................................275
Конструирование признаков.................................................................................................277
Признаки пользователей......................................................................................................280
Разработка модели...............................................................................................................282
Выбор модели......................................................................................................................282
Обучение модели.................................................................................................................285
Оценка................................................................................................................................287
Автономные метрики............................................................................................................287
Оперативные метрики..........................................................................................................287
Эксплуатация......................................................................................................................289
Предсказательный пайплайн................................................................................................289
Другие темы для обсуждения...............................................................................................290
Итоги..................................................................................................................................291
Ссылки...............................................................................................................................292
Глава 11. Списки возможных знакомых.................................................................................293
Введение............................................................................................................................293
Прояснение требований.......................................................................................................293
Формулировка проблемы в виде задачи МО...........................................................................294
Определение цели МО.........................................................................................................294
Выбор категории МО............................................................................................................295
Подготовка данных..............................................................................................................299
Инженерия данных..............................................................................................................299
Конструирование признаков.................................................................................................301
Разработка модели..............................................................................................................303
Выбор модели.....................................................................................................................303
Графовые нейронные сети (GNN)..........................................................................................303
Обучение модели.................................................................................................................304
Оценка...............................................................................................................................308
Автономные метрики...........................................................................................................308
Оперативные метрики..........................................................................................................308
Эксплуатация......................................................................................................................309
Эффективность....................................................................................................................309
Проектирование системы МО.................................................................................................311
Другие темы для обсуждения.................................................................................................314
Итоги...................................................................................................................................315
Ссылки.................................................................................................................................316
Послесловие.........................................................................................................................317
Download
Rutracker.org не распространяет и не хранит электронные версии произведений, а лишь предоставляет доступ к создаваемому пользователями каталогу ссылок на торрент-файлы, которые содержат только списки хеш-сумм
Как скачивать? (для скачивания .torrent файлов необходима регистрация)
[Профиль]  [ЛС] 

MiroRu

Стаж: 19 лет 5 месяцев

Сообщений: 2

MiroRu · 18-Янв-24 18:14 (спустя 3 часа)

Спасибо! Добавьте, пожалуйста, epub, если есть.
[Профиль]  [ЛС] 
 
Ответить
Loading...
Error