Бизнесово подумал про омнимодальность
Наблюдаю за картинками с ChatGPT, где генерятся животные как люди, люди как игрушки, а игрушки снова как люди и так до бесконечности. Понял, что успех подобной фичи заложен в комбинации языкового запроса с визуальным (или любой другой формой контента), что обозначается с прикладного
Следите за руками:
Выход новой технической фичи априори не меняет мою жизнь (пользователя). Я живу своими процессами, что-то новое непонятное пробовать не хочу, потому что и так процессы работают. Чтобы обратить мое внимание, тут надо зайти через радикальное решение проблемы, либо через фан. В первом случае я меняю что-то в своей жизни (знакомство с фичей), что оптимизирует процесс на порядок, а во втором случае просто получаю развлекуху, которую показываю друзьям (потенциальные новые пользователи). И как думаю, капитански наберитесь воздуха, омнимодальность это делает сразу через фана и решение проблемы.
Например, я понял из генератора изображений ChatGPT, что тот учитывает визуальный и текстовый контекст, от чего я могу запрашивать у него разные приколы и показывать другим людям. Пускай мне захотелось определить, какой я суп и почему именно такой. ChatGPT минутку попыхтит над запросом и выдаст персонализированный ответ, где даёт фан и решение проблемы. А далее я показываю это другим людям, что влечёт цепную реакцию «надо сделать тоже самое»
Омнимодальность раскрывает бесконечную песочницу, которая нативно показывает, почему та или иная фича нужна мне. При этом сервис необязательно должен быть песочницей или омнимодальным, чтобы привлечь внимание (Perplexity, я тебя очень люблю!), просто это повышает кардинальный интерес. Или я один такой?
🤖 InNeuralNetwork
>>Click here to continue<<
