音频搜索公司 DeepGram,定位语音搜索AI大脑,DeepGram想做“音频版”

news/2024/10/7 13:48:17/
aidu_pl">

1. 亦仁分享

  • DeepGram 成立于 2015 年,位于美国山景城,是一家基于 AI 技术的音频搜索引擎公司。运用机器学习进行语音识别、搜寻重要时刻并对音频和视频进行分类,帮助用户快速索引和浏览音频和视频文件,包括电话语音、会议语音、播客、视频片段等。
  • 最近一次融资为 2016 年 9 月来自 Metamorphic Ventures、Y Combinator 的 180 万美元的种子投资,迄今总的融资额为 203 万美元。
  • 定位语音搜索 AI 大脑:DeepGram 想做音频版“谷歌”。

2. 评论

  • wulujia:国内有解决方案吗?
    • 亦仁回复:国内我没注意到有,讯飞提供了音频转文字的功能。
    • wulujia 回复:我估计类似分答这样 ugc 的语音业务需求量应该不小。
    • 亦仁回复:视频平台估计也需要,像快手这样的。
    • 小胡子哥回复:有点,忘了名字,已经做成了产品。
  • sai:有识别图片中文字技术服务吗?
    • 亦仁回复:有的,搜索 OCR 会发现很多服务。

二、关于微信小程序工具的讨论

1. 亦仁分享

  • 一个做微信小程序工具的思路:想看杭州限购政策,网上信息要么长篇大论要么过期。如果有一款将各个城市限购限贷信息结构化、标准化的小工具,应该可以满足很多人需求。展示了有很多关于房子的小工具的图片,部分已上线小程序。

2. 评论

  • hoolaa:不懂房地产,其中的赢利点在哪儿?
    • 亦仁回复:我 yy 几个赢利点:
      • 提供历史限购信息查询和下载。免费版本只能查最新的,付费的可以查历史数据。
      • 往公众号或者平台或者 app 引流,将流量卖给房地产商。
      • 找人来开课:做房地产的知识付费。
  • hoolaa:挣了钱,再投资房产。
  • AlexHe:做银行消费抵押贷款广告应该不错。
  • 张战辉:直觉上这些工具房产网站很早就有了吧。除了分析研究相关人士,买房的人更多关注现在和未来。过去的信息搜索引擎就解决了。除非能从历史数据得出对当下决策有支撑的结论,可是这个事情除了任志强大部分经济学家都错了。
    • 亦仁回复:网站已经有了,小程序没有。
  • 月月:小程序的场景和社群可能比网站更适合传播。
  • JoanneLisa 回复:这里有做小程序的公司吗?可以在这里接单了。

http://www.ppmy.cn/news/1535717.html

相关文章

数据分析之Spark框架介绍

文章目录 概述一、发展历程与背景二、核心特点三、生态系统与组件四、应用场景五、与其他大数据技术的比较 核心概念1. 弹性分布式数据集(RDD, Resilient Distributed Dataset)2. 转换(Transformations)和动作(Actions…

C++ 语言特性10 - 委托构造函数

1:什么是委托构造函数? 在C中,委托构造函数(Delegating Constructor)是一种特殊的构造函数,它在构造函数的初始化列表中调用同一个类中的另一个构造函数,从而实现代码的复用。这种特性在C11中引…

ChatGPT相关参数示例

max_token用于控制最大输出长度,若ChatGPT的回复大于max_tokens,则对输出结果进行截断。 from openai import OpenAI client = OpenAI(base_url="https://api.chatanywhere.tech/v1" ) response = client.chat.completions.create(model="gpt-3.5-turbo"…

极客兔兔Gee-Cache Day1

极客兔兔7Days GeeCache - Day1 interface{}:任意类型 缓存击穿:一个高并发的请求查询一个缓存中不存在的数据项,因此这个请求穿透缓存直接到达后端数据库或数据源来获取数据。如果这种请求非常频繁,就会导致后端系统的负载突然…

Python知识点:如何使用Nvidia Jetson与Python进行边缘计算

开篇,先说一个好消息,截止到2025年1月1日前,翻到文末找到我,赠送定制版的开题报告和任务书,先到先得!过期不候! 如何使用Nvidia Jetson与Python进行边缘计算 Nvidia Jetson平台是专为边缘计算设…

Android中级控件

文章目录 图形定制1.图形Drawable2.形状图像3.九宫格图片4.状态列表图形 选择按钮1.复选框CheckBox2.开关按钮Switch3.单选按钮 文本输入1.编辑框EditText2.焦点变更监听器3.文本变化监听器 对话框1.提醒对话框2.日期对话框DatePickerDialog3.时间对话框TimePickerDialog 图形定…

LeetCode 228 Summary Ranges 解题思路和python代码

题目: You are given a sorted unique integer array nums. A range [a,b] is the set of all integers from a to b (inclusive). Return the smallest sorted list of ranges that cover all the numbers in the array exactly. That is, each element of nums …

多模态大语言模型(MLLM)-Blip2深度解读

前言 Blip2是一个多模态大语言模型,因其提出时间较早(2023年),且效果较好,很快成为一个标杆性工作。Blip2中提出的Q-former也成为衔接多模态和文本的重要桥梁。 Blip2发表时间是2023年,现在引用已经3288了…