最近几年精力有限比较少在知乎上回答问题了,不过每次看到精彩的问题和回答还是会手痒。
趁这次MiniCPM-4模型发布,集中分享下最近一年多来的感悟和想法,也是最近跟同学朋友经常探讨的话题,抛砖引玉一起交流。
为什么做端侧模型 规模法则可持续发展问题。
大模型在规模法则(Scaling Law)的指引下,参数规模从2018年的千万量级发展到2024年的千亿量级(Llama3.1-405B)。
到了2024年下半年,逐渐出现规模法则是否可持续的大讨论…。
上一篇 : 螳螂虾这么厉害,为什么没有称霸海洋?
下一篇 : NAS的盘是否需要一次性买齐?
美国国务卿称将开始吊销中国学生签证,包括在关键领域学科学生,影响有多大?在美中国留学生该怎样应对?...
如何评价林志玲?...
为什么 Go 语言的 Error Handling 被某些人认为是一个败笔?...
DLM(扩散语言模型)会成为2025年的Mamba吗?...