MathPrompter 使用 Zero-shot 思维链提示技术生成多个代数表达式或 Python 函数,以不同方式解决同一个数学问题,从而提高输出结果的可信度。
相比其他基于提示的 CoT 方法,MathPrompter还会检查中间步骤的有效性。
基于175B 参数 GPT,使用MathPrompter方法将MultiArith 数据集的准确率从78.7%提升到了92.5%!
MIT Chemists Discover the Structure of a Key Coronavirus Protein
Attention Actor-Critic algorithm for Multi-Agent Constrained Co-operative Reinforcement Learning