Подход к автоматическому анализу отзывов о товарах и услугах интернет-магазина | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 11 мая, печатный экземпляр отправим 15 мая.

Опубликовать статью в журнале

Автор:

Рубрика: Информационные технологии

Опубликовано в Молодой учёный №10 (457) март 2023 г.

Дата публикации: 10.03.2023

Статья просмотрена: 90 раз

Библиографическое описание:

Искакова, М. Е. Подход к автоматическому анализу отзывов о товарах и услугах интернет-магазина / М. Е. Искакова. — Текст : непосредственный // Молодой ученый. — 2023. — № 10 (457). — С. 11-14. — URL: https://moluch.ru/archive/457/100621/ (дата обращения: 30.04.2024).



Одним из преимуществ систем электронной коммерции является то, что они позволяют покупателям и продавцам знакомиться с обзорами товаров и услуг. В настоящее время в самых популярных интернет-магазинах имеются сотни и даже тысячи отзывов на те или иные товары, которые содержат ценную информацию о качестве предлагаемого ассортимента. Это является причиной поиска путей их компьютерной обработки. В статье предлагается подход к автоматизированному анализу отзывов клиентов, основанный на технологии обработки естественного языка и применении методов машинного обучения. Предложена модель анализа и ее реализация с помощью программного продукта RapidMiner.

Ключевые слова: интеллектуальный анализ данных, сеть майнинг, анализ, поддержка Векторные машины, электронная коммерция, RapidMiner.

Введение

В последние годы Интернет зарекомендовал себя как один из самых богатых и легкодоступных источников информации. В глобальной сети есть большое количество документов, данные, аудио- и видеофайлы, множество записанных отзывов клиентов. Все эти ресурсы являются носителями знаний о бизнесе и после соответствующей компьютерной обработки они могут внести свой вклад в более подробный анализ и помочь выявить и изучить новые отношения. В сфере электронной коммерции основная деятельность осуществляется через динамические онлайн-системы. Одной из основных проблем для этого вида бизнеса является создание быстрых и точных решений в соответствии с изменениями рыночной конъюнктуры. Системы электронной коммерции генерируют подробные и разнообразные отчеты, которые в основном основаны на статистической обработке данных, хранящихся в базе данных. В последнее время для более подробного и углубленного анализа в этой области был использован интеллектуальный бизнес-анализ на основе как структурированных, так и неструктурированных данных.

Практика показала, что в настоящее время новые клиенты интернет-магазинов во многом полагаются на мнениях, размещенных от существующих клиентов. Кроме того, производители и сервис-поставщики также заинтересованы в анализе мнений клиентов для улучшения качества и стандартов продуктов и услуг. Все это требует поиска новых и эффективных способов преобразования неструктурированных данных, таких как мнения клиентов, в подробные отчеты и анализы.

Цель данной статьи — предложить подход к автоматизированному анализу отзывов о товарах интернет-магазина, основанные на изучении существующих технологий обработки естественного языка.

І. Теоретические основы вычислительной техники для обработки естественного языка

Концепция обработки естественного языка (NLP) — это широкий термин, который можно рассматривать как синтез искусственного интеллекта и компьютерной лингвистики. В настоящее время многие исследователи изучают различные аспекты интеллектуальной обработки текста. В общем, обнаружение знаний в неструктурированных данных в литературе известно, как интеллектуальный анализ текста. Этот процесс осуществляется за счет применения технологии интеллектуального анализа данных (DM) к неструктурированным текстовым данным. Накопление все большего количества информации в Сети становится предпосылкой для извлечения знаний из Интернет-источников, таких как веб-страницы. Рождается новая концепция извлечения знаний из веб-ресурсов — веб-майнинг (WM).

Веб-майнинг обычно делится на следующие три подобласти:

— интеллектуальный анализ веб-контента (WCM) — извлечение полезной информации из содержимого веб-документов;

— структурированный веб-анализ (WSM) — извлечение полезных знаний на основе структуры веб-сайтов;

— интеллектуальный анализ использования Интернета (WUM) — извлечение полезной информации из данных об использовании интернет-ресурсов.

За последние годы, в основном благодаря развитию веб-приложений и социальных сетей, в Интернете накопилось большое количество отзывов покупателей, обмен впечатлениями, чувствами, эмоциями. По этой причине многие исследователи сосредоточили свои исследования на двух взаимосвязанных областях, таких как анализ мнений (OM) и анализ настроений (SA) (рис. 1).

Веб-майнинг, интеллектуальный анализ мнений

Рис. 1. Веб-майнинг, интеллектуальный анализ мнений

Термин «анализ мнений» был введен Дейвом, Лоуренсом и Пенноком. Они определяют его как «набор результатов поиска по заданному элементу, генерирующий список атрибутов продукта (характеристики качества и т. д.) и объединяющий мнения о каждом из них (плохое, смешанное, хорошее)».

Анализ настроений впервые упоминается в работах Даса, Чена и Тонга (2001). Они используют этот термин в автоматическом анализе и оценке текста. Впоследствии во множестве исследований обсуждаются различные аспекты анализа настроений, и во многих из них этот термин используется как синоним анализа мнений, поскольку из записанных комментариев извлекаются эмоции и настроения.

Анализ настроений на уровне документа пытается классифицировать общую позицию в документе как положительную, отрицательную или нейтральную. Для классификации уровня документа можно использовать как контролируемые, так и неконтролируемые методы обучения. При анализе настроений на уровне предложений полярность каждого предложения рассчитывается с использованием тех же методов.

II. Подход к автоматизированному анализу отзывов покупателей интернет-магазина

Системы электронной коммерции представляют собой динамические веб-приложения, обеспечивающие интерактивность и общение с клиентами. Записанные мнения клиентов являются одним из лучших показателей того, насколько хорош сервис интернет-магазина и что нравится или не нравится покупателям, соответствуют ли продукты и услуги описаниям и презентациям, что еще клиенты хотят открыть для себя в интернет-магазине и общие оценки клиентов.

В данной статье для исследования и анализа отзывов покупателей мы предлагаем использовать методы классификации, чтобы сначала выделить мнения о различных характеристиках товаров, а затем оценить полярность отзывов покупателей о них. Модель, которая используется для анализа, показана на рис. 2

Модель анализа отзывов о товарах и услугах интернет-магазина

Рис. 2. Модель анализа отзывов о товарах и услугах интернет-магазина

Обычно процесс извлечения мнений из текстовых данных является нетрадиционной задачей, потому что данные не структурированы, основаны на WCM и целесообразно анализировать онлайн-отзывы клиентов, выполнив следующие шаги:

  1. Сбор и запись обзоров продуктов.
  2. Предварительная обработка текста отзывов о товарах.
  3. Применение методов обработки текста.
  4. Анализ и интерпретация результатов.

Сбор отзывов клиентов — это функция, интегрированная в большинство систем электронной коммерции. В одних системах просмотры мы записываем прямо на веб-страницу в формате html, а в других они записываются в базу данных. Однако вне зависимости от хранилища отзывы представляют собой неструктурированные данные — текст.

Предварительная обработка текста — это процесс подготовки текста для прикладных методов интеллектуального анализа данных, таких как: классификация, кластеризация и другие. Текстовые документы обычно имеют большое количество слов, не являющихся носителями полезной информации, и поэтому анализировать все слова нецелесообразно. Рекомендуемые этапы предварительной обработки отзывов клиентов:

— токенизация — разделение полнотекстового обзора на список слов;

— лемматизация — процесс приведения слова к его нефлективной словарной форме;

— удаление стоп-слов — это вспомогательные слова, несущие мало информации о содержании текста, такие как: «за», «после», «так», «потом», «назад», «против»;

— капитализация текста — преобразование символов в нижний регистр.

Многие из вышеупомянутых исследований показывают, что для анализа тональности отзывов клиентов о продуктах и услугах целесообразно использовать методы машинного обучения — обучения с учителем, из которых наиболее успешно применяются для категоризации текста линейные классификаторы Машины опорных векторов (SVM) классификатор на основе алгоритма Naive Bayes (NB)

Заключение

Быстрое развитие социальных сетей и возможностей обмена, которые обеспечивают многие приложения, работающие в Интернете, является предпосылкой для создания больших коллекций потребительских отзывов, впечатлений, общих чувств и эмоций. Интеллектуальный бизнес-анализ этих отзывов клиентов важен для бизнеса и поэтому является предметом исследовательского интереса в последние годы. Поскольку конкретного алгоритма для полноценного поиска знаний в тексте не существует, по результатам существующих исследований в данной работе предлагается подход к анализу отзывов покупателей интернет-магазинов, с помощью которого можно классифицировать высказанные мнения и сделать выводы о качество товаров может быть сделано.

Полученные в результате новые знания могут помочь улучшить ассортимент продукции и повысить удовлетворенность клиентов, а для компаний, занимающихся электронной коммерцией, это крайне важно, поскольку от этого во многом зависят доходы от продаж. Кроме того, этот вид анализа может использоваться менеджерами для создания успешных бизнес-стратегий на основе полученных в результате глубоких и точных анализов и прогнозов. Извлечение новых знаний из интернет-ресурсов может стать важным конкурентным преимуществом для компаний, занимающихся электронной коммерцией, поскольку в целом способствует совершенствованию их бизнеса.

Литература:

  1. Анкиткумар, Д., Бадре, Р., Киникар, М. (2014) Обзор по анализу настроений и анализ мнений. Международный журнал инновационных исследований в области компьютеров и техника связи. 2 (11). с. 6633–6639.
  2. Кули, Р., Мобашер, Б. и Сривастава, Дж. (1997) Веб-майнинг: информация и обнаружение паттернов во всемирной паутине. Труды Международного Конференция по инструментам с искусственным интеллектом. с. 558–567
  3. Д’Аванцо, Э., Пилато, Г. (2015) Изучение мнений пользователей социальных сетей в помощь решения покупателей о покупках. Компьютеры в человеческом поведении. 51. с. 1284–1294 гг.
  4. Дэйв, К., Лоуренс, С. и Пеннок, Д. (2003) Добыча арахиса в галерее: Извлечение мнений и семантическая классификация отзывов о продуктах. Труды WWW. с. 519–528.
  5. Эциони, О. (1996) Всемирная паутина: трясина или золотая жила? Коммуникации АКМ. 11. с. 65–68.
Основные термины (генерируются автоматически): электронная коммерция, WCM, анализ настроений, естественный язык, данные, интеллектуальный анализ данных, полезная информация, NLP, интеллектуальный бизнес-анализ, машинное обучение.


Ключевые слова

анализ, интеллектуальный анализ данных, электронная коммерция, RapidMiner, сеть майнинг, поддержка Векторные машины

Похожие статьи

Искусственный интеллект и большие данные | Статья в журнале...

Ключевые слова:искусственный интеллект, большие данные, big data, глубокое обучение.

Многие используют термины AI, машинное обучение (ML) и глубокое обучение (DL)

Поэтому охват ИИ продолжает расширяться в различных секторах и сферах бизнеса.

Получая информацию от сложных датчиков, GPS, камер и радарных систем, программное обеспечение...

Методы интеллектуального анализа данных | Статья в журнале...

Под интеллектуальным анализом данных понимают обработку информации и выявление

Интеллектуальный анализ+ данных (многие знакомы с этим термином по его английскому

Данные требования создали сложный процесс интеллектуальному анализу данных.

Подумайте о комбинировании бизнес-требований по интеллектуальному анализу данных с...

Анализ тональности текста для прогнозирования цен на...

Ключевые слова: фондовый рынок, анализ мнений, анализ тональности.

Другие методы включали информацию о настроении в модель прогнозирования.

По мере увеличения объема данных, их анализ и классификация становится все более важным аспектом.

Ключевые слова: анализ тональности текста, сентимент анализ, обработка естественного...

Исследование методов сентимент-анализа русскоязычных текстов

Ключевые слова: анализ тональности текста, сентимент анализ, обработка естественного языка, компьютерная

Сентимент-анализ (англ. sentiment analysis) — выявление тональности комментария при помощи методов NLP

Ошибки данных методов объясняются следующими проблемами

3. Александр Уланов, Обработка текстов на естественном языке (Лекция 10.

Распознавание сарказма в задаче определения тональности...

Анализ тональности текста относится к задачам информационного поиска.

Анализ мнений — это тип обработки естественного языка для отслеживания настроения общественности о

Анализ тональности текста — это раздел интеллектуального анализа данных...

Анализ тональности текста — это сложный процесс, касающийся выделение полезной.

Разработка программного продукта для определения авторства...

На основе данных, полученных в результате сравнительного анализа в этой статье, можно сделать выводы о

Ключевые слова:классификация текста, машинное обучение, обработка естественного

Анализ мнений — это тип обработки естественного языка для отслеживания настроения

Анализ тональности текста — это раздел интеллектуального анализа данных...

Обзор систем анализа тональности текста на русском языке

2. Компонент анализа тональности текста в составе систем «Аналитический курьер» и «X-files» [5]

Ключевые слова:классификация текста, машинное обучение, обработка естественного языка

Анализ мнений — это тип обработки естественного языка для отслеживания настроения

Анализ тональности текста — это раздел интеллектуального анализа данных...

Обучение человека и машины | Статья в сборнике международной...

Ключевые слова: машинное обучение, обучение человека, эффективное обучение.

Применение адаптивных методик в обучении человека рассмотрено в работах [1], [2], [3].

Но прежде чем проверять работы данные системы проходят этап обучения.

Ключевые слова: искусственный интеллект, интеллектуальный анализ данных, машинное обучение...

Анализ систем Business Intelligence в РФ | Статья в журнале...

 Анализ текущего состояния рынка систем Business Intelligence в Российской Федерации

Ключевые слова: Business Intelligence, BI, бизнес-аналитика, IT-инструменты, машинное

Системы Business Intelligence (бизнес-аналитика, бизнес-анализ) по своей сути являются

Одновременно машинное обучение помогает повысить точность данных и уменьшить число...

Похожие статьи

Искусственный интеллект и большие данные | Статья в журнале...

Ключевые слова:искусственный интеллект, большие данные, big data, глубокое обучение.

Многие используют термины AI, машинное обучение (ML) и глубокое обучение (DL)

Поэтому охват ИИ продолжает расширяться в различных секторах и сферах бизнеса.

Получая информацию от сложных датчиков, GPS, камер и радарных систем, программное обеспечение...

Методы интеллектуального анализа данных | Статья в журнале...

Под интеллектуальным анализом данных понимают обработку информации и выявление

Интеллектуальный анализ+ данных (многие знакомы с этим термином по его английскому

Данные требования создали сложный процесс интеллектуальному анализу данных.

Подумайте о комбинировании бизнес-требований по интеллектуальному анализу данных с...

Анализ тональности текста для прогнозирования цен на...

Ключевые слова: фондовый рынок, анализ мнений, анализ тональности.

Другие методы включали информацию о настроении в модель прогнозирования.

По мере увеличения объема данных, их анализ и классификация становится все более важным аспектом.

Ключевые слова: анализ тональности текста, сентимент анализ, обработка естественного...

Исследование методов сентимент-анализа русскоязычных текстов

Ключевые слова: анализ тональности текста, сентимент анализ, обработка естественного языка, компьютерная

Сентимент-анализ (англ. sentiment analysis) — выявление тональности комментария при помощи методов NLP

Ошибки данных методов объясняются следующими проблемами

3. Александр Уланов, Обработка текстов на естественном языке (Лекция 10.

Распознавание сарказма в задаче определения тональности...

Анализ тональности текста относится к задачам информационного поиска.

Анализ мнений — это тип обработки естественного языка для отслеживания настроения общественности о

Анализ тональности текста — это раздел интеллектуального анализа данных...

Анализ тональности текста — это сложный процесс, касающийся выделение полезной.

Разработка программного продукта для определения авторства...

На основе данных, полученных в результате сравнительного анализа в этой статье, можно сделать выводы о

Ключевые слова:классификация текста, машинное обучение, обработка естественного

Анализ мнений — это тип обработки естественного языка для отслеживания настроения

Анализ тональности текста — это раздел интеллектуального анализа данных...

Обзор систем анализа тональности текста на русском языке

2. Компонент анализа тональности текста в составе систем «Аналитический курьер» и «X-files» [5]

Ключевые слова:классификация текста, машинное обучение, обработка естественного языка

Анализ мнений — это тип обработки естественного языка для отслеживания настроения

Анализ тональности текста — это раздел интеллектуального анализа данных...

Обучение человека и машины | Статья в сборнике международной...

Ключевые слова: машинное обучение, обучение человека, эффективное обучение.

Применение адаптивных методик в обучении человека рассмотрено в работах [1], [2], [3].

Но прежде чем проверять работы данные системы проходят этап обучения.

Ключевые слова: искусственный интеллект, интеллектуальный анализ данных, машинное обучение...

Анализ систем Business Intelligence в РФ | Статья в журнале...

 Анализ текущего состояния рынка систем Business Intelligence в Российской Федерации

Ключевые слова: Business Intelligence, BI, бизнес-аналитика, IT-инструменты, машинное

Системы Business Intelligence (бизнес-аналитика, бизнес-анализ) по своей сути являются

Одновременно машинное обучение помогает повысить точность данных и уменьшить число...

Задать вопрос