LLM资讯

大模型技术资讯博客

探索人工智能与大模型的最新资讯、研究成果和技术博客。每天更新行业前沿动态,包括深度学习、机器学习、神经网络等领域的最新进展。

SQLCoder2与SQLCoder-7B模型发布:7B参数规模与卓越性能

SQLCoder2与SQLCoder-7B模型正式开源,这两款模型分别基于StarCoder和Mistral-7B模型进行了微调,专注于处理SQL查询。SQLCoder2是一款15B参数的大型语言模型,而SQLCoder-7B则是首个7B参数规模的模型,几乎与SQLCoder2有相同的性能表现。在开源评估框架中,SQLCoder在训练中未见过的新模式上超越了所有可用的大型语言模型,除了GPT-4。当针对特定模式进行微调时,其性能甚至超过了所有模型,包括GPT-4。

2023-11-26 21:331,453

SQLCoder2与SQLCoder-7B发布:7B参数规模与卓越性能

近日,SQLCoder2与SQLCoder-7B两款大模型开源,其中SQLCoder2是原SQLCoder模型的显著改进版本,而SQLCoder-7B则是首个7B参数规模的模型,性能几乎与SQLCoder2相同。这两款模型在开源评估框架上的表现超越了除GPT-4外的所有可用大型语言模型,并在特定架构上的微调后,其性能甚至超越了GPT-4。

2023-11-26 21:231,101

揭秘Q*:神秘的大模型技术革新

近日,一篇关于Q*的讨论激发了科技界的好奇心。Q*被认为是一种先进的人工智能(AGI),可能会对未来的人工智能发展产生重大影响。本文将探讨Q*的潜在能力以及它对行业和社会的潜在影响。

2023-11-23 16:28415