YY前任CTO赵斌今日正式确认,其创业公司“声网Agora(http://cn.agora.io/)”将首次亮相Chinajoy的BtoB综合商务洽谈区C864,展示其为游戏行业度身定制的解决方案。
开发者可以通过短时间的开发快速集成声网研发的SDK,使自己的游戏拥有全球最高质量的实时音视频通话功能。目前该方案已经全面覆盖iOS、Android、Windows等智能手机及电脑操作系统,以及COCOS、Unity等游戏开发引擎。
受限于手机终端,手游一直以来依赖于文字通讯,玩家在操作游戏和聊天只能选其一,导致社交性不足。而音视频通话的加入则能解放玩家的双手,可以在畅快游戏的同时进行无障碍的沟通。这无疑将大大提升手游社交性,直接带来的作用就是增加玩家互动频率、增长玩家在线时长、提升ARPU直接影响游戏收入。而为玩家提供良好社交体验的游戏往往可以获得玩家的忠诚度,流失率降低会使得手游生命周期延长。
赵斌表示,正是因为看到了未来音视频通话在移动游戏领域的无限发展潜力,声网选择Chinajoy作为其在国内的“首秀”。
值得注意的是,手机游戏独立部署高质量的实时通话服务,是技术门槛很高的事情。大游戏公司在进行不少的人力、资金投入之后或许可以实现音视频通话功能,但离高质量的音视频通话、适应各类网络环境的转换、将安装包压缩到最小还有不少的距离。而对于更多的小游戏公司、独立游戏开发者来说,实现音视频通话功能都难上加难。
而技术正是声网最自信的地方,“我们的目标是做一家世界级的中国技术公司,”赵斌称。正是冲着这样的目标,在成立至今的近2年时间内,声网选择先将技术做到极致:
首先,搭建由YY前技术委员会执行主席带领的技术开发团队,由IEEE DSP 特邀编辑领衔的音视频算法团队。目前,声网90%以上都是技术人员,整个团队拥有超过 20 年的 VoIP 技术积累,有年服务 4000 亿分钟语音通话的经验。其次,声网在全球部署了近百个数据中心和近千台服务器,能够保障跨大洲、跨国家、跨运营商网络的实时数据传输质量,其能提供的音视频通话质量在与硅谷最具实力的技术对手面前都极具竞争力。
而声网在技术上的实力和追求,也得到了业内的认可和支持。一方面,公司先后获得雷军的顺为资本、晨兴刘芹以及SIG闫丹等明星投资方近3000万美元的投资。另一方面,就手游市场而言,声网已经与热酷休闲跑酷手游《找你妹2015》、横版街机格斗手游《三国志吞食天地》等十余款手游产品达成协议。
而除了游戏行业以外,声网还将陆续面向在线教育、远程医疗、社交网络、在线招聘、企业会议、O2O等领域推出专业的解决方案。
好文章,需要你的鼓励
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。
浙江大学研究团队通过OmniEAR基准测试揭示了当前AI模型在物理世界推理方面的严重缺陷。测试显示,即使最先进的AI在明确指令下能达到85-96%成功率,但面对需要从物理约束推断行动的任务时,成功率骤降至56-85%。研究发现信息过载反而降低AI协作能力,监督学习虽能改善单体任务但对多智能体协作效果甚微,表明当前架构存在根本局限性。
纽约大学和Aimpoint Digital Labs的研究团队首次揭示了Transformer模型训练中"大规模激活"的完整发展轨迹。这些影响力比普通激活大千倍的"超级激活"遵循可预测的数学规律,研究者开发出五参数公式能以98.4%准确率预测其变化。更重要的是,通过调整模型架构参数如注意力密度、宽深比等,可以在训练前就预测和控制这些关键激活的行为,为设计更高效、量化友好的AI模型提供了全新工具。