
中国电信东说念主工智能商量院(TeleAI)"复杂推理大模子" TeleAI-t1-preview 认真发布。TeleAI-t1-preview 使用了强化学习查考舛误,通过引入探索、反念念等念念考范式,擢升模子在数学推导、逻辑推理等复杂问题的准确性。在好意思国数学竞赛 AIME 2024、MATH500 两项数学基准评测中开云kaiyun,TeleAI-t1-preview 分手以 60 和 93.8 分的得益,逾越 OpenAI o1-preview、GPT-4o 等标杆模子。在商量生级别问答测试 GPQA Diamond 中,TeleAI-t1-preview 得分逾越 GPT-4o。(科创板日报)
