Mastering Text Analytics: A Hands-on Guide to NLP Using Python / Осваиваем текстовую аналитику: Практическое руководство по NLP с использованием Python
Год издания: 2025
Автор: Kadre Shailendra, Kadre Shailesh, Dey Subhendu / Кадр Шайлендра, Кадр Шайлеш, Дей Субхенду
Издательство: Apress Media LLC
ISBN: 979-8-8688-1582-9
Язык: Английский
Формат: PDF
Качество: Издательский макет или текст (eBook)
Количество страниц: 479
Описание: This book is a comprehensive guide to mastering Natural Language Processing (NLP), a rapidly growing field in AI-powered text and data analytics. It equips you with tools and techniques to extract valuable insights from both structured and unstructured data, enabling you to uncover insights beyond the reach of traditional data analysis methods and stay competitive in this evolving domain.
The book starts with foundational concepts, such as collecting and extracting data for NLP projects, before progressing to advanced topics like applications of transfer learning in NLP and Large Language Models (LLMs). Each chapter emphasizes real-world applications and includes practical case studies to ensure the knowledge is immediately applicable. Throughout the book, readers will find Python code demonstrations, hands-on projects, and detailed explanations of key concepts. Special features include business use cases from industries like healthcare and customer service, practice exercises to reinforce learning, and explorations of emerging NLP technologies. These elements make the book not only informative but also highly engaging and interactive.
By the end of the book, the reader will have a solid foundation in Generative AI techniques to apply them to complex challenges. Whether you’re a budding data scientist or a seasoned professional, this guide will help you harness the power of AI-driven text and data analytics effectively.
What you will learn:
Understand NLP with easy-to-follow explanations, examples, and Python implementations.
Explore techniques such as transformers, word embeddings, and pragmatic analysis in real-world contexts.
Work with real-world datasets and apply pre-processing, tokenization, and text extraction using NLP libraries.
How to build complete NLP pipelines from data collection to model implementation, including sentiment analysis and chatbots.
Learn state-of-the-art methods like deep learning techniques in NLP, large language models (LLMs), and zero-shot learning in NLP.
Who this book is for:
This book is tailored for data scientists, machine learning engineers, AI practitioners, and software developers seeking to learn NLP techniques and apply them to solve problems.
Эта книга представляет собой всеобъемлющее руководство по освоению технологии обработки естественного языка (NLP) - быстро развивающейся области анализа текста и данных с использованием искусственного интеллекта. Он предоставляет вам инструменты и методы для извлечения ценной информации как из структурированных, так и из неструктурированных данных, позволяя получать информацию, недоступную традиционным методам анализа данных, и оставаться конкурентоспособными в этой развивающейся области.
Книга начинается с основополагающих концепций, таких как сбор и извлечение данных для проектов NLP, а затем переходит к более сложным темам, таким как применение трансферного обучения в NLP и больших языковых моделях (LLM). В каждой главе особое внимание уделяется реальным приложениям и приводятся практические примеры, позволяющие сразу же применить полученные знания. На протяжении всей книги читатели найдут демонстрации кода на Python, практические проекты и подробные объяснения ключевых концепций. Специальные разделы включают примеры использования в бизнесе из таких отраслей, как здравоохранение и обслуживание клиентов, практические упражнения для закрепления полученных знаний и изучение новых технологий НЛП. Эти элементы делают книгу не только информативной, но и очень увлекательной и интерактивной.
К концу книги у читателя будут прочные знания о методах генеративного ИИ, позволяющие применять их в сложных задачах. Независимо от того, являетесь ли вы начинающим специалистом по обработке данных или опытным профессионалом, это руководство поможет вам эффективно использовать возможности анализа текста и данных с помощью ИИ.
Чему вы научитесь:
Разберитесь в НЛП с помощью простых для понимания объяснений, примеров и реализаций на Python.
Изучите такие техники, как трансформаторы, встраивание слов и прагматический анализ в реальных контекстах.
Работайте с реальными наборами данных и применяйте предварительную обработку, токенизацию и извлечение текста с использованием библиотек NLP.
Как построить полные конвейеры NLP от сбора данных до реализации модели, включая анализ настроений и чат-ботов.
Изучите самые современные методы, такие как методы глубокого обучения в НЛП, большие языковые модели (LLM) и обучение с нуля в НЛП.
Для кого предназначена эта книга:
Эта книга предназначена для специалистов по обработке данных, инженеров по машинному обучению, практиков искусственного интеллекта и разработчиков программного обеспечения, которые хотят изучить методы НЛП и применять их для решения проблем.
Примеры страниц (скриншоты)
Оглавление
About the Authors ........................................................................................................xv
About the Technical Reviewer .........................................................................................xix
Acknowledgments .........................................................................................................xxi
Introduction .................................................................................................................xxiii
Chapter 1: Natural Language Processing: An Introduction ..................................................1
Chapter 2: Collecting and Extracting the Data for NLP Projects ............................................53
Chapter 3: NLP Data Preprocessing Tasks Involving Strings and Python Regular Expressions ...83
Chapter 4: NLP Data Preprocessing Tasks with NLTK ..........................................................107
Chapter 5: Lexical Analysis ............................................................................................149
Chapter 6: Syntactic and Semantic Techniques in NLP .......................................................211
Chapter 7: Advanced Pragmatic Techniques and Specialized Topics in NLP ............................275
Chapter 8: Transformers, Generative AI, and LangChain ....................................................337
Chapter 9: Advancing with LangChain and OpenAI ............................................................411
Chapter 10: Case Study on Symantec Analysis .................................................................439