Сообщение сгенерировано автоматически что это значит

Самая ужасная страшилка для желающих разместить написанный компьютером контент на своих сайтах — санкции поисковых систем. Нас тоже в свое время пугали тем, что сайт с неуникальными и /или сгенерированными текстами, будет плохо индексироваться или что он вообще попадет под бан. При этом точных требований к текстам никто нам сказать не смог.

Вообще тема уникального контента и его роли в продвижении сайтов больше похожа на оккультные знания. Каждый следующий «специалист» обещает на своей странице открыть страшную правду, но правда так и не открывается, а суть многих дискуссий на форумах сводиться к тому, что, скажем, Яндекс, распознает сгенерированный контент с помощью магии. Не такими словами, но смысл в этом.

Поскольку недавно к нам обратились заказчики с задачей создать описаний для товаров на сайте, мы решили подробнее изучить этот вопрос. Какие алгоритмы существуют для определения автоматически написанных текстов, какие свойства должен иметь текст чтобы не быть распознанным как веб-спам, и какие средства могут его генерировать?

Автоматическое Создание УНИКАЛЬНЫХ СТАТЕЙ! Новая Нейросеть Генерирует Тексты за Секунды



В последние годы уникальный текст (и вообще текст) стал распространенным инструментом, который SEO-специалисты рекомендуют для продвижения сайтов в поисковых системах. Совсем в последние годы, владельцы сайтов поняли, что заказывать написание текстов людям достаточно накладно, ведь цены на авторские тексты во все времена находились в диапазоне $1-$3 за 1000 знаков. Понятно, что владельцу интернет-магазина даже со скромным ассортиментом в 3-4 тыс наименований надо заплатить за тексты от 300 000 рублей, причем трата это не разовая, поскольку ассортимент имеет тенденцию обновляться. Естественно, на страницах сайтов появились автоматически сгенерированные описания товаров.

Как на самом деле поисковая система распознает автоматически сгенерированный контент.
… этого мы конечно не знаем. Но, общий принцип метода тайны не составляет, и обратившись к первоисточникам можно сделать некоторые обоснованные выводы о границах возможного. Начнем с того, что на сайте научных публикаций Яндекса имеется статья с многообещающим названием «Поиск неестественных текстов» [1].

Там сказано примерно следующие “в неестественном тексте должно быть нарушено распределение пар [слов]… количество редких, нехарактерных для языка пар должно быть завышено по сравнению со стандартом, а количество частых пар – занижено”. Перед нами, таким образом, первая группа методов То есть, речь так или иначе идет о сравнении статистических параметров данного текста с параметрами «естественных» текстов. Помимо распределения пар, могут использоваться частоты n-грамм большего размера. В более современных работах [2] применяются также частоты n-грамм не самих слов, а частей речи, когда сначала каждому слову определяется часть речи (СУЩ-ПРИЛ-СУЩ-ГЛАГ), а потом подсчитывают частоты полученных n-грамм, и так далее.

Ясно, что самые примитивные описания, сгенерированные с помощью подстановки параметров товаров в шаблонный текст избегают этого фильтра по причине того, что исходный шаблон заготовлен человеком и, соответственно, имеет естественные характеристики. Это конечно, при условии, что в шаблоне приглажены соответствия родов и падежей, чтобы не получалось ничего вроде «Купить стиральная машина за 10399 рубля».

Нейросеть для определения текста, сгенерированного языковыми моделями. chatGPT/GPT3/BLOOM — Саид

Генераторы на основе современных моделей языка, такие как нейросетевые модели языка, также весьма вероятно избегают этого фильтра, так как общее правило гласит «чтобы поймать текст сгенерированный некоторой моделью языка, надо использовать более совершенную модель языка». А более совершенная модель языка может быть в дефиците, и к тому же требовать огромных вычислительных затрат, так что ее использование для определения автоматических текстов в масштабах интернета просто будет нерациональным

Но генераторы на основе модели языка, примененные напрямую, генерируют тексты, лишенные смысла. Например, такие «Надежность водонагревателей «аристон» побеждает рейтинг бойлеров».

Поскольку владельцы интернет-магазинов как правило не хотят, чтобы водонагреватели побеждали рейтинги бойлеров, они предпочитают простые шаблонные тексты. Но и здесь есть некоторая потенциальная трудность.

Шаблонный текст не отличим от естественного до тех пор, пока он имеется в единственном экземпляре. Размноженные же, они становятся предметом второго класса методов определения машинных текстов. Суть метода в том, что все тексты, написанные на базе шаблона похожи друг на друга за исключением частей, куда вставляются параметры конкретного товара.

Получается то, что называется в английской литературе ”near dublicates” — почти дубликаты. Поисковые системы умеют их определять [3], используя всем известный метод шинглов и его усовершенствованные варианты. Если же использовать дополнительно синонимайзер, то увеличится число маловероятных языковых конструкций и текст станет опознаваемым для первой группы алгоритмов [1]. Кроме того, существуют алгоритмы, специфически направленные против синонимайзеров — они убирают из текста все слова, для которых имеются синонимы в словаре, и сравнивают тексты по оставшимся словам [4].

Читайте также:  Как самой подключить мобильный банк через телефон

Таким образом, алгоритмы распознавания машинно-генерируемых текстов являясь с одной стороны достаточно сложными, все же не содержат в себе никакой магии и сверхинтеллекта. При желании можно их воспроизвести для целей тестирования текстов, что затратно по времени, но в общем не сложно.

Философское отступление
Мы столкнулись с тем, что есть люди, считающие машинные тексты злом, засоряющим интернет и предназначенным для обмана пользователей. Но мы считаем, что это вряд ли правомочно относить к осмысленным текстам, описывающие конкретные товары по параметрам. Ведь эти тексты содержат фактически верную информацию о товаре. Размещая на странице такой текст мы обозначаем ее содержимое для поисковой системы, поэтому это не является обманом поисковых систем или покупателей.

Практика: Насколько хороши машинные тексты?
Принимая во внимание вышеизложенное, мы остановились на гибридном методе генерации текстов. В нем, сначала базовый каркас текста генерируется с помощью заданной вручную грамматики (подробнее в предыдущей статье), а затем сверху применяется нейросетевой анализатор, натренированный на определение мест, где можно вставить или удалить определенные классы слов без потери смысла. Необходимость создания порождающей грамматики вручную конечно удорожает стоимость решения, но все равно она остается на порядок меньшей, чем заказ текстов копирайтеру. Теперь собственно по качеству.
Читабельность:

«Смеситель для раковины Grohe Allure 19386000 из новой коллекции Allure, стоимостью всего 5800 рублей. Скрытый монтаж обеспечивает повышенное удобство эксплуатации и, конечно, установки. Cистема GROHE SilkMove позволяет обеспечить исключительно легкое движение рычага.

Специальное покрытие, произведенное по технологии StarLight создает долговечность и сохраняет хороший вид изделия на протяжении долгих лет. Вертикальный монтаж с двумя монтажным отверстиями весьма удобен и не должен вызвать трудностей. Величина выноса излива здесь равна 220 мм. Больший размер выноса приводит к тому, что использовать изделие становится намного проще.

Все изделие в общем имеет вес равный 1,955 кг. Минимальное давление для данной модели равняется 1 бар. В подключении к электричеству нет необходимости. Бесплатная доставка и надежное, проверенное годами, качество широко известного всем немецкого бренда — главные причины купить смеситель Grohe Allure 19386000».

Конечно, это не великое литературное произведение, но явных огрехов нет. Определить, что текст сгенерирован автоматически трудно, даже для человека.
Уникальность:
a) Глобальная уникальность. Суть глобальной уникальности в том, чтобы текст был уникален относительно всех других текстов, имеющихся в интернете на момент публикации.

Для проверки глобальной уникальности мы использовали известный сервис text.ru (для целей объективности, в этой статье мы приводим результаты анализа со сторонних сервисов, а не данные наших алгоритмов).

Как видно, с глобальной уникальностью нет никаких проблем. Сервис жалуется на орфографию, но при рассмотрении ошибки связаны с тем, употреблением слов ”Allure”, “StarLight” и других специфических терминов, которые сервис не знает. Примечание: это данные до размещения текстов на сайте заказчика. Сейчас, естественно, эти тексты можно обнаружить там.

б) Локальная уникальность. Как мы уже говорили, слишком похожие тексты могут быть сочтены поисковой системой дубликатами друг друга, что может выдать их искусственное происхождение. Для этого мы использовали сервис, размещенный на сайте backlinkmanager (другие реализации сравнения с помощью алгоритма шинглов дают похожие результаты)

Два текста про очень похожие модели с совпадающими параметрами сходны всего на 5%, причем в значительной степени сходство обусловлено упоминанием названия товара «Смеситель для мойки Grohe Alira”. Будем считать это хорошим результатом, ведь есть не так много способов по разному описать один и тот же набор параметров товара.

Индексация поисковыми системами
Индексация машинно-генерируемых текстов была проверена нами ранее на примере сайта reviewdot.ru. Страницы данного сайта не имеют уникального контента. Поэтому вначале этот сайт никак не хотел попадать в индекс Яндекса (из более чем ста тысяч страниц в индексе оказались около 1300 штук).

Мы с этим упорно боролись, разместив сначала шаблонные тексты (число страниц в индексе выросло до 5000), потом использовав более сложные алгоритмы генерации, подобные рассмотренному выше. На сегодняшний день в индексе Яндекса около 70 000 страниц. Хотя что конкретно повлияло на ситуацию — наши усилия или изменения в алгоритмах Яндекса, нам неизвестно. Тем не менее, факт остается фактом — страницы, содержащие автоматически сгенерированные тексты успешно попадают в индекс поисковых систем. Несмотря на все опасения SEO специалистов, монстры не явились, что сожрать нас сайт не попал под санкции поисковых систем, хотя к тому имелись теоретические основания.

Читайте также:  Как найти хорошую работу за границей

Причем в индексе не только страницы, но и конкретно автоматически сгенерированные тексты, в чем можно убедиться, введя фрагменты этих текстов в поисковую строку:

А значит, как минимум, машинно-генерируемый контент можно использовать для того, чтобы страница стала релевантной определенным запросам.

Конечно, надо заметить, что мы размещали не бессмысленные тексты, а тексты содержащие полезную пользователю информацию (reviewdot анализирует отзывы на товары, оставленные на разных сайтах и представляет пользователю краткую аннотацию об отмеченных плюсах и минусах).

# Общее описание и настройка

До версии 4.3.0 в RunaWFE для межпроцессного взаимодействия использовались такие элементы как «Отправить/Получить сообщение» (отправить сообщение/получить сообщение, пример использования механизма сообщений), близкими аналогами которых в BPMN являются сигналы и сообщения. В настоящий момент данные элементы заменены (с поддержкой обратной совместимости) на события обработки и генерации, которые делятся на следующие типы:

В палитру графических элементов добавлены соответственно «Генерация события», «Обработка событий» (иконки в палитре соответствуют сообщениям до версии RunaWFE 4.3.0)

Signals 1.png

Тип события выбирается в свойствах элемента. Каждому типу соответствует свой значок.

Signals 2.png

События обработки можно использовать как в виде отдельного элемента так и помещать в: узел-действие, мультидействие, задачу сценария, подпроцесс (композицию), мультиподпроцесс. Генерация события используется только как отдельный элемент.

Signals 5.png

По умолчанию элемент помещенный на схему бизнес-процесса имеет тип «сообщение», в узел — «сигнал».

Signals 3.png

К элементу «Обработка события» помещенному в узел можно присоединить исходящий переход. В случае получения события на присоединенном переходе генерируется новая точка управления. При этом старая точка управления может оставаться. За данное поведение отвечает свойство «Прерывающий» — Да/Нет. По умолчанию установлено в значение «Да» т.е. при переходе старая точка управления удаляется.

Если событие не прерывающее, то значок обводится пунктиром.

Signals 4.png

# Сигнал

Используются преимущественно для межпроцессного взаимодействия.

# Отмена

Инициируют или реагируют на отмену транзакции.

На примере ниже видно, что выполняется мультиподпроцесс в рамках которого запущено два подпроцесса. В мультиподпроцесс помещена обработка события «Отмена», событие прерывающее (т.к. значок не обведен пунктиром).

Signals 10.png

Если выполнить задачу «Отменить заявки», то сгенерированное сообщение будет обработано элементом «Обработка события» в мультиподпроцессе, в результате чего управление пойдет по исходящему переходу, а подпроцессы автоматически завершатся.

Signals 11.png

Signals 12.png

Если использовать свойство «Прерывающий» со значением «нет», то подпроцессы завершены не будут

Signals 13.png

# Ошибка

Позволяют сымитировать ошибку, а также выполнить обработку бизнес-исключения в процессе.

Замечание. Обработка исключений поддерживается только в задаче сценария (скрипте) и задаче бота..

Рассмотрим пример использования обработки бизнес-исключения.

Signals 6.png

В задачу-сценария помещен элемент «обработка события-ошибка», к которому присоединен исходящий переход в узел-действие «Task1». В сценарии используется SQL обработчик с намеренно некорректной конфигурацией. В свойствах маршрутизации события используется переменная сообщения — «error_event_message», содержащая текст ошибки в случае возникновения исключения.

Signals 7.png

Запустим данный процесс на выполнение

Signals 8.png

Скрипт выполнился с ошибкой и точка управления пошла по исходящему из события-ошибки переходу в задачу Task1.

В переменной error содержится текст ошибки:

Signals 9.png

Источник: runawfe.ru

Триггерные письма: как не надо говорить «спасибо»

Как сказать спасибо клиенту и не напортачить? Мы провели исследование писем благодарности и выяснили, что делает триггерные рассылки полезными, а что может снизить эффективность и привести к обратному эффекту: отказу от взаимодействия, падению доверия и лояльности.

Letter_2

Персонализированное триггерное письмо работает лучше шаблонного. Их чаще открывают, чаще переходят по ссылкам, уровень отказов по переходам из триггерных писем крайне низок (менее 15% по данным Sendsay.ru). А слово «Спасибо» в теме письма повышает уровень открытия (open rate).

Для персонализации писем важно учесть три фактора: ● поведение пользователя на сайте — что смотрел, что сравнивал, что добавлял в корзину, какими разделами интересовался; ● поведение пользователя в рассылке — какие рассылки открывал, по каким ссылкам переходил, из каких писем совершил целевое действие; ● личные данные — пол, возраст, сфера деятельности. Для анализа мы выбрали письма благодарности Триггерные письма благодарности устанавливают доверительные отношения, показывают ценность клиента для компании, повышают лояльность.

Такие письма снижают риск отправки всей цепочки в спам. Говорить спасибо — это круто. Но так, как это делают некоторые компании, благодарить нельзя. Некоторые рассылки — это проявление неуважения к клиентам. Благодарственные письма должны подогревать интерес пользователя к сотрудничеству с компанией, а не отталкивать.

Даже автоматически сгенерированное триггерное письмо может заставить клиента почувствовать себя особенным.

Истинных писем благодарности не так уж много. Это эксклюзив. А когда вы в последний раз отправляли бескорыстное письмо с искренним спасибо?

Типичные ошибки триггерных писем

Ошибка №1. Цель письма — отнюдь не благодарность Письма благодарности — это две крайности: либо чрезмерная формальность (сухое «спасибо за подписку»), либо погоня за продажей или конверсией. Из 1000 проанализированных писем лишь около 10% — это истинные письма-спасибо без продаж и конверсий. В некоторых «спасибо» так завуалировано, что и отыскать его сложно.

Читайте также:  Скажи за что тебя любить за одиночество

Вот как здесь: Letter_3Вы видите благодарность? А она есть! Зачем эту маленькую строчку «Спасибо» делать столь мелкой и нечитаемой? Благодарить можно за разные действия: за подписку, за первую покупку, за повторные приобретения, за участие в какой-либо акции. Но во всех этих случаях работают одни и те же правила.

Чтобы благодарность в письме стала искренней, само письмо полезным, а вы смогли проявить заботу о клиенте, добавьте ценности: ● укажите полезные контакты; ● представьте команду или ответственного сотрудника; ● расскажите, как пользоваться сервисом. Если благодарите за заказ, укажите новые способы доставки, новые отделения, новые методы оплаты.

Если благодарите за подписку, расскажите, что клиент получит в рассылке, и как часто будут приходить письма. Такие письма хочется сохранить как шпаргалку. Вот отличный пример, как сказать клиенту спасибо, чтобы он не захотел с вами расставаться: Letter_4

Ошибка №2.

Неудачное обращение к клиенту Из 1000 проанализированных писем лишь 40% обращаются к клиентам по имени. Обратиться к клиенту по имени в письме технически несложно. Важно, чтобы информация о клиенте была разобрана по признакам (то есть нужно знать не только имя клиента, но и пол), чтобы не получилось вот так: Letter_5Или как здесь (не с таким треском, как «уважаемый Ольга», но все же): Letter_6Обращение по имени и фамилии сразу наводит на мысль о том, что письмо шаблонное. Ведь если мы пишем сами, то никогда не скажем клиенту «Здравствуйте, Иванов Иван».

Задача персонализации — по максимуму снизить эффект шаблонности. Это хороший способ добавить письму человечности.

Самый нелепый пример: Letter_7А зачем имя, если есть email? И так пойдет! Есть отличные решения, как обратиться к клиенту, когда он не представился.

Letter_8Можно использовать и такой вариант, если это уместно и приемлемо для целевой аудитории: Letter_9Кстати, Яндекс не пользуется своим преимуществом и не персонализирует рассылки КиноПоиска: Letter_10Ошибка №3. Шаблонность Чрезмерная шаблонность доходит в некоторых случаях до абсурда.

Автоматически сгенерированное письмо отнюдь не должно быть таким: Letter_11или таким: Letter_12В глубине души пользователи догадываются, что любое сообщение генерируется автоматически. Но не столь же явно нужно это демонстрировать.

Для примера покажем, как незначительное письмо-уведомление – даже без персонального обращения – превращается в дружественное и запоминающееся: Letter_13Ошибка №4. Письма благодарности не ассоциируются с брендом Даже бесплатные инструменты рассылки позволяют создать простой узнаваемый шаблон, чтобы идентификация письма с брендом происходила не только по имени отправителя, но и по визуальным триггерам: цвета, шрифты, логотип.

Все еще часто встречаются письма, не содержащие брендовой айдентики, а ведь мы хотели бы, чтобы пользователь открыл и понял, кто прислал письмо и по какому поводу. Letter_14Ошибка №5. Отвратительное форматирование текста Письма с темой «Спасибо» открывают чаще.

Как мы уже выяснили, спасибо — лишь повод донести порцию полезной информации. Нередко мы работаем над форматированием текста на сайте и забываем о читабельности текста в рассылке: Letter_15А ведь в этой рассылке указана полезная и важная информация для подписчиков. Ошибка №6.

Отвратительный текст Подшучивать над клиентом можно по-разному. Можно заставить гадать, от кого рассылка, можно не отформатировать текст, можно написать так, что с первых предложений глаза сломаешь: Letter_16Ошибки пунктуации и громоздкие конструкции еще больше усложняют восприятие текста. Невольно начинаешь сомневаться в компетентности компании. Но не все так грустно. Есть хорошие письма, и их становится все больше.

Анатомия хорошего благодарственного письма

Letter_17● правильное обращение; ● представление; ● благодарность; ● ценность для клиента. Еще один пример хорошего письма-спасибо: Letter_18

Вывод:

● Качественных триггерных писем все еще крайне мало. Маркетологи кидаются из крайности в крайность: персонализируют там, где это неуместно, убивая лояльность и доверие, либо автоматизируют письма-спасибо так, что утрачивается какая-либо ценность.

Составив хороший шаблон и правильно применив персонализацию, вы сможете установить контакт с подписчиками, повысить open rate, получить реальный фидбек. Ваши автоматические уведомления выделятся среди сотен других. ● В триггерном письме важно не только правильное обращение, но и дизайн, форматирование текста и сам текст. ● Чтобы написать хорошее письмо благодарности, следуйте алгоритму: — персональное обращение и приветствие; — представление, кто вы; — повод письма и благодарность; — ценность письма-спасибо; — контакт — желательно не горячая линия по всем вопросам, а конкретный отдел по вопросам темы рассылки. Делайте автоматические письма так, будто вы пишете их своим друзьям. А с друзьями гораздо проще говорить о важном, верно?

Источник: searchengines.guru

Рейтинг
( Пока оценок нет )
Загрузка ...
Lady Today