KintaMiao’s Website

InfoLLM

LLM Application or Model

智谱清言 ⭐️⭐️⭐️⭐️⭐️

智谱清言(GLM-4)是智谱 AI 公司于2023训练的语言模型,是目前中文大模型中数一数二的存在,其背后是清华大学的技术支持,因此实力强也是理所应当,目前完全免费,无任何收费项目

  • ==Highlight==:
    • 目前综合实力数一数二的中文大模型
    • 提供类似 GPTs 的智能体功能
    • 支持上网查询内容
  • ==Official Website==:
  • ==Relevant Models==:
  • ==Personal Evaluations==:
    • GLM4 成为了当前中文大模型的标杆,无论是上下文参考还是逻辑推理亦或是知识检索,GLM4 都能够轻松胜任,这使得 GLM4 成为了首选,但是其普通模式下联网检索信息的能力较差,如有联网检索信息的需求,最好切换至高级联网模式
  • ==NB==: 网页端最大输入为 2000 字

    Kimi Chat ⭐️⭐️⭐️⭐️⭐️

    Kimi,由月之暗面科技有限公司(Moonshot AI)开发的人工智能助手,作为全球首个支持 20 万中文输入的LLM,Kimi Chat 可以说是出道即巅峰,继续深挖,其背后的技术团队更是堪称豪华阵容,同时 Moonshot 在最近也获得了 10 亿美元的融资,实力可想而知。Kimi Chat 目前也是完全免费
  • ==Highlight==:
    • 高保真 Context 压缩,无可匹敌的上下文能力和超长中文输入 Tokens
    • 支持上网查询信息,且效果相当不错
  • ==Official Website==:
  • ==Relevant Models==:
    • moonshot-v1 (均无更多信息)
      • moonshot-v1-8k
      • moonshot-v1-32k
      • moonshot-v1-128k
  • ==Personal Evaluations==:
    • TL;DR: 印象深刻,已成为主力工具
    • Kimi Chat让人看到了一丝曙光,其最大的优势——高保真 Context 压缩,正如白牛(huixiangdou)所言:这个亮点足够闪耀,以至于可以忽略当下缺陷。Kimi Chat对于长文本的记忆和理解能力超乎了我的想象,它不会因为文章过长而舍弃文中的一些细节,而会牢牢的记住每个字,以至于你扔给它一本小说,抽问它一些细节内容它仍然可以对答如流
    • 令我感到震惊的还有它的细节,在扔给它一篇 Markdown 文本(内含链接),你若问它这篇文章有没有什么问题,它甚至会帮你访问每个链接并告诉你这个链接有没有问题,例如我上次写错了一个链接,它就告诉我提供的链接里有一个指向了 404,那一刻我真的被它的细节所震撼

      Chinese LLM Benchmark

      C-Eval ⭐️⭐️⭐️⭐️⭐️

      包含了13948个多项选择题,涵盖了52个不同的学科和四个难度级别,结果极为科学可靠,但模型不全且只有少量模型为官方测试数据
  • ==Official Website==:
  • ==Result==:
  • ==Official Website==:
  • ==Result==:
    • 官网: 同上,左侧可选择榜单
    • Gradio(aka.SuperCLUE琅琊榜): SuperCLUE
    • GitHub: SuperCLUE

      CLiB ⭐️⭐️⭐️

      模型覆盖全面,更新相对较快,但测试题目较少,不过仍然值得参考
  • ==Official Website==:缺失
  • ==Result==: