环球科创网

AI日报:微软推设计神器Microsoft Designer;苹果开源小模型 DCLM-Baseline-7B;小爱宣布新增AI文档问答等功能

更新时间:2024-07-22 15:01:32

导读 欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创...

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、微软推设计神器Microsoft Designer

作为一款集成人工智能技术的设计应用程序,Microsoft Designer让设计变得更简单、高效。用户可以在任何设备上访问这个强大的工具,无缝集成于Microsoft365应用,提供智能对象检测、创新工具和图像风格重塑等功能。

2、ElevenLabs发布Turbo2.5模型:速度提升3倍,覆盖中文等32种语言

在人工智能的世界里,ElevenLabs推出的Turbo2.5模型再次突破语言界限。该模型不仅在性能和多语言支持方面表现卓越,速度提升3倍,延迟降低至300毫秒,为动态互动提供更强大支持。用户体验方面,提供了丰富的语言选择和便捷的转换功能,同时确保数据安全和合规性。

3、苹果AI发布7亿参数开源语言模型DCLM

苹果公司与多家机构合作推出了7亿参数的开源语言模型DCLM,该模型在训练过程中使用了庞大的数据令牌,帮助理解和生成语言。DCLM提供了标准化的数据集优化工具,帮助研究人员进行有效实验。新模型在重要测试中取得了显著进展,同时降低了计算资源的需求。

4、小米大模型小爱新增AI文档问答、AI图片编辑功能

小米公司宣布小爱同学新增了「AI 图片编辑」功能,用户可进行背景转换、风格转换、路人消除、智能扩图和图片问答等操作。同时,「大模型小爱」还新增了「AI文档问答」功能,提供更智能的文档处理体验。用户需更新至V6.126版本体验新功能。

5、BlazeBVD: 一种革命性的视频去闪技术

视频制作和图像处理领域的关键技术之一是视频的“去闪”技术。BlazeBVD作为一种新型去闪算法,不仅能快速去除视频中的闪烁现象,还保持视频内容完整性和色彩真实性。它的出现革命性改变了视频后期制作的方式。

6、百度沈抖:大模型应用进入爆发期

在2024中国联通合作伙伴大会上,百度集团执行副总裁、百度智能云事业群总裁沈抖发表了关于深度拥抱人工智能+,加快发展新质生产力的演讲。沈抖强调人工智能是创新的关键技术,大模型是人工智能的前沿阵地,并展示了大模型调用量的指数级增长。百度通过与企业合作,发现底层算力管理平台的重要性,自主研发了百舸算力平台,支持大模型的快速迭代。

7、微软研究人员SpreadsheetLLM项目

微软研究人员最近发布了名为SpreadsheetLLM的创新研究,旨在解决大语言模型在解析电子表格时遇到的难题。该项目通过一种编码框架,使得大语言模型能够“读懂”电子表格的内容,有望显著提升电子表格的数据管理和分析效率,同时使用户能够用自然语言向AI提出问题,无需掌握复杂的公式和操作。

8、谷歌2024年硬件大秀:Pixel9、Gemini以及新款可折叠手机

谷歌将提前举行大型硬件活动,宣布Pixel9等新品,领先于苹果iPhone16发布。Gemini话题备受关注,新设备将引领Android领域AI功能。Android15带来新功能和UI调整,Google Assistant的未来仍有悬念。Pixel Watch3和Pixel Buds Pro2也将亮相。

9、Arcee AI发布开源语言模型Arcee-Nova:基于Qwen2-72B 性能接近 GPT-4

Arcee AI最新推出的开源语言模型Arcee-Nova表现优异,接近GPT-4水准,标志着重要里程碑,为AI社区带来新希望。Arcee-Nova结合Qwen2-72B-Instruct和定制调优模型,功能全面,广泛应用于客户服务、内容创作、软件开发和教育等多个领域。

10、日本超市引入AI微笑监测系统

日本连锁超市AEON引入了名为“Mr Smile”的AI微笑监测系统,旨在提高员工的服务质量和顾客体验。虽然系统在提升服务态度方面取得了显著效果,但也引发了争议和担忧,涉及员工微笑的自然性和顾客骚扰问题。与其他行业做法相比,如麦当劳的“0元笑容”理念和福冈超市的慢速结账通道,AEON的举措受到了不同看法。

11、格灵深瞳开源视觉语言表示学习模型RWKV-CLIP

格灵深瞳开源了RWKV-CLIP模型,这是一个结合了Transformer和RNN优点的视觉语言表征学习器。该模型通过图文预训练任务,使用从网站获取的图像-文本对扩展数据集,显著提高了视觉和语言任务的性能。研究团队引入了多样化的描述生成框架,利用大型语言模型从基于网络的文本、合成字幕和检测标签中合成和细化内容,以解决噪声数据问题并提高数据质量。

12、Neo4j LLM 知识图谱AI生成器:将非结构化数据转换为知识图谱

将杂乱无章的数据转化为有用的信息变得越来越重要,Neo4j推出了全新工具Neo4j LLM知识图谱构建器,利用强大的机器学习模型将非结构化数据转化为结构化的知识图谱,提高数据处理效率。工具灵活性高,用户可自定义提取模式和清理数据,提供多种数据查询技术,使数据分析更高效智能。

13、OpenAI CEO承认“GPT-4O MINI”字母数字组合的命名方式存在问题

在OpenAI推出新一代GPT大语言模型GPT-4o Mini后,CEO山姆·奥特曼承认产品命名存在问题,引发广泛关注和批评。他表示需要重新考虑命名方案,展现了对命名问题的重视。尽管面临挑战,OpenAI在其他项目中展现出创意的命名方式。未来是否会对现有命名体系进行全面改名,仍是未知数。

14、StockBot:AI驱动的实时股票数据聊天机器人,让投资更智能

在信息爆炸的时代,投资者需要快速、准确的股票数据和新闻。StockBot是由Lama3-70B驱动的聊天机器人,运行在Groq上,能以闪电般的速度处理数据,通过Vercel生成式UI展示用户友好的界面。它支持股票、外 汇、债券和加密货币,提供全面的市场分析,为投资者提供强大的助手。

免责声明:本文由用户上传,如有侵权请联系删除!