Toggle navigation
AI Content Maker
Home
Users
Tasks
Posts
Telegram
Assistant Bots
Bots
Accounts
Aggregators
Creative groups
Scheduler groups
Edition TG Channels
Seeds
Seeds
Seed Categories
Seed Source TG Channels
Seed Source Web
Seed Source Reddit
Seed Source Pinterest
Payments
Items
History
Media
Post actions
Editions
Validation
List
Create
Edit
Title
Content
### OPENAI ПОЗВОЛЯЕТ РАЗРАБОТЧИКАМ СОЗДАВАТЬ ПРИЛОЖЕНИЯ С РЕАЛЬНОВРЕМЕННЫМ ГОЛОСОВЫМ ВЗАИМОДЕЙСТВИЕМ - ЗА ЗНАЧИТЕЛЬНУЮ ПЛАТУ На ежегодном дне разработчика OpenAI в Сан-Франциско компания представила новый интерфейс прикладного программирования (API) для работы в реальном времени. Эта функция позволяет разработчикам отправлять и получать голосовые данные во время операций предсказания с использованием большой языковой модели (LLM). OpenAI предлагает использовать эту функцию для более плавного взаимодействия между человеком и языковой моделью. Однако стоимость использования реального времени API высока. Базовая модель GPT-4o стоит $2.50 за миллион текстовых токенов на вход и $10 на выход. Для работы в реальном времени, включая голосовые токены, цена возрастает до $5 и $20 соответственно, а для голосовых токенов - $100 и $200 за миллион токенов. Пример использования голосового взаимодействия: автоматизированный коуч по здоровью или языковой репетитор. OpenAI также предложила способ снижения затрат – кеширование запросов, что позволяет повторно использовать ранее отправленные токены и снижает стоимость. На конференции также была представлена "дистилляция" LLM, позволяющая использовать данные крупных моделей для обучения меньших. Это упрощает процесс, который раньше был сложным и требовал множества операций через разные инструменты. Теперь, используя пары входов и выходов больших моделей, как GPT-4o, можно улучшать меньшие модели, такие как GPT-4o mini. К существующей услуге тонкой настройки добавлена возможность работы с изображениями. Например, компания Grab использовала изображения уличных знаков для улучшения картографирования маршрутов доставки, повысив точность на 20% и 13% соответственно. Цены на настройку изображений устанавливаются в $3.75 за миллион входных токенов и $15 за выходные токены, а обучение моделей изображений стоит $25 за миллион токенов.
Url
https://www.zdnet.com/article/openai-lets-developers-build-real-time-voice-apps-at-a-substantial-premium/#ftag=RSSbaffb68
Cancel