统计、机器学习与编程知识的原创博客

重磅！PyTorch官宣2.0版本即将发布，最新torch.compile特性说明！

2022年的PyTorch Conference在新奥尔良举办。刚刚会上的keynote官宣PyTorch2.0版本即将到来。PyTorch是目前最流行的深度学习框架之一，它的易用性被广大的用户所喜爱。关于PyTorch2.0，官方透露了一些值得期待的特性。

2022/12/03 09:24:25 阅读 2091

pytorch

使用Jupyter Notebook编程与python脚本编程的差异

Jupyter Notebook虽然在教学等领域有着非常大的优势，但是实际编程中，它的效率、可维护性等方面与python脚本相比的差距到底在哪也一直不那么清晰。就在上个月底，JetBrains的研究人员使用了大量的数据详细对比了二者的差异。这里总结一下其主要结论。

2022/04/10 22:40:35 阅读 2098

Jupyter/编程/编程工具

Java入门基础笔记-4

2018/09/22 19:48:43 阅读 2112

Java/入门/基础/新手/笔记

重磅！ChatGLM2-6B免费商用了~

在七月初，ChatGLM-6B免费商用之后，ChatGLM2-6B宣布免费商用了！

2023/07/14 23:28:31 阅读 2117

ChatGLM-6B/ChatGLM2-6B

ChatGPT颠覆更新！即将发布的ChatGPT新版本带来巨变，新界面和可以自定义GPT-4功能：可以对接私有数据与私有接口的个性化ChatGPT即将到来！

ChatGPT是当前大模型服务最前沿和风向标，每一次改动都会引起巨大的关注。此前，在ChatGPT的js脚本中就隐藏了即将发布的ChatGPT Team计划。而现在，新的ChatGPT UI代码和功能也被发现。新的GPT除了界面的巨大变化外，还有一个类似自定义AI Agent能力，可以直接接入自己的私有数据和API接口对外提供服务！十分震惊！

2023/11/03 15:28:17 阅读 2126

ChatGPT/GPT对接接口/GPT对接私有数据/GPT自定义/MagicMaker/新版本ChatGPT

Python生态系统中5个NLP工具库

Python是目前最流行的编程语言，也是开放生态做得最好的编程语言之一。大多数深度学习框架、机器学习的框架都有很优秀的Python版本。这篇博客主要为大家介绍5个python生态系中解决NLP任务的框架。

2022/04/10 20:23:13 阅读 2130

NLP/工具

大模型评测的新标杆：超高难度的“Humanity’s Last Exam”（HLE）介绍

近年来，大语言模型（LLM）的能力飞速提升，但评测基准的发展却显得滞后。以广泛使用的MMLU（大规模多任务语言理解）为例，GPT-4、Claude等前沿模型已能在其90%以上的问题上取得高分。这种“评测饱和”现象导致研究者难以精准衡量模型在尖端知识领域的真实能力。为此，Safety for AI和Scale AI的研究人员推出了Humanity’s Last Exam大模型评测基准。这是一个全新的评测基准，旨在成为大模型“闭卷学术评测的终极考验”。

2025/02/03 19:12:29 阅读 2132

HLE/大模型评测/大模型评测基准/评测基准

重磅！阿里巴巴开源自家首个MoE技术大模型：Qwen1.5-MoE-A2.7B，性能约等于70亿参数规模的大模型Mistral-7B

阿里巴巴的通义千问一直是开源领域最强大的大模型之一。就在今天，阿里巴巴首次开源了他们家的MoE技术大模型Qwen1.5-MoE-A2.7B，这个模型是使用现有的Qwen-1.8B模型作为起点，通过类似merge技术进行合并得到的。

2024/03/29 00:40:06 阅读 2133

MoE/Qwen1.5-MoE/混合专家大模型/通义千问

overflow：hidden清除浮动的一个简单的列子

2018/10/11 20:04:55 阅读 2136

清除浮动

DeepSeekAI开源国产第一个基于混合专家技术的大模型：DeepSeekMoE-16B，未来还有1450亿参数的MoE大模型

混合专家（Mixture of Experts）是大模型一种技术，这个技术将大模型划分为不同的子专家模型，每次推理只选择部分专家网络进行推理，在降低成本的同时保证模型的效果。此前Mistral开源的Mixtral-8×7B-MoE大模型被证明效果很好，推理速度很棒。而幻方量化旗下的DeepSeek刚刚开源了可能是国产第一个MoE技术的大模型，DeepSeek-MoE 16B。

2024/01/11 15:04:10 阅读 2137

DeepSeek/DeepSeekMoE/MoE/混合专家

可能是史上最强大的AI Agent！OpenAI重磅更新：整合了多模态、外部访问、数据分析后的GPT-4更像是AI Agent了！

此前OpenAI的ChatGPT Plus版本为GPT-4模型提供了多个强大的插件供大家使用，包括基于Bing的带网络浏览的Browse、文本生成图片的DALL·E3、高级数据分析功能等。就在几个小时前，OpenAI的部分用户收到了官方的一个非常重磅的更新，即上传任意文档的分析以及整合了所有工具后的GPT-4！这个功能被称为GPT-4（All Tools）！这个工具可以在一次对话中自主选择调用多个不同工具完成用户的输入指令，非常接近AI Agent形态！

2023/10/29 14:56:41 阅读 2139

AIAgent/AllTools/GPT-4/OpenAI

OpenAI发布新一代向量大模型，接口已经更新到text-embedding-3-large，embedding长度升级，价格最高下降5倍！

决定向量检索准确性的核心是向量大模型的能力，即文本转成embedding向量是否准确。今天，OpenAI宣布了他们第三代向量大模型text-embedding，模型能力增强的同时价格下降！

2024/01/26 14:40:34 阅读 2149

OpenAI/text-embedding-3/向量大模型

你成功啦！！！

模拟登陆

2018/06/22 18:51:41 阅读 2149

模拟登陆

Java入门基础笔记-5

2018/09/22 19:52:24 阅读 2152

Java/入门/基础/新手/笔记

OpenAI开源最新的3D物体生成预训练模型——Point-E

三维物体的生成（3D）其实是AR/VR领域一个非常重要的技术。但是，受限于算力和现有模型的限制，三维物体的生成相比较图像生成来说效率太低。目前，最好的图像生成模型在几秒钟就可以根据文字生成图像结果，但是3D物体的生成通常需要多个GPU小时才可以生成一个对象。为此，OpenAI在今天开源了一个速度极快的3D物体生成模型——Point-E，需要注意的是，这是今年来OpenAI罕见的源代码和预训练结果都开源的一个模型。

2022/12/20 21:13:23 阅读 2157

3D生成/OpenAI/开源模型

IE6的兼容问题

2018/10/11 20:35:42 阅读 2164

IE6兼容问题

Java入门基础笔记-3

2018/09/22 19:45:11 阅读 2165

Java/入门/基础/新手/笔记

Java入门基础笔记-10

2018/09/22 20:04:33 阅读 2175

Java/入门/基础/新手/笔记

PandasTutor——一个用于可视化pandas操作的神器

pandas是Python中一个非常重要的分析工具，在数据处理方面应用非常广泛。但是，也是因为pandas包含的操作很多，所以初学者很多时候也不能特别能理解这些操作。为了让初学者能够充分理解pandas中的操作，Pandas Tutor将pandas的操作变成可视化的过程，让我们充分理解这个过程。

2021/12/05 19:40:35 阅读 2175

pandas/python/编程

重磅！GPT-3.5可以微调了！OpenAI发布GPT-3.5 Turbo微调接口

此前，OpenAI的CEO说今年等算力不那么紧张的时候就可以让大家微调OpenAI的GPT模型，现在这个功能已经发布了！OpenAI发布了GPT-3.5 Turbo的微调接口，允许大家用自己的数据微调GPT-3.5模型！

2023/08/23 08:57:48 阅读 2179

GPT-3.5/GPT4/OpenAI/微调

统计、机器学习与编程知识的原创博客

重磅！PyTorch官宣2.0版本即将发布，最新torch.compile特性说明！

使用Jupyter Notebook编程与python脚本编程的差异

css的继承性

并集选则器和通配符

Java入门基础笔记-4

超级链接a标签的三个属性

重磅！ChatGLM2-6B免费商用了~

ChatGPT颠覆更新！即将发布的ChatGPT新版本带来巨变，新界面和可以自定义GPT-4功能：可以对接私有数据与私有接口的个性化ChatGPT即将到来！

margin的IE6兼容问题

Python生态系统中5个NLP工具库

大模型评测的新标杆：超高难度的“Humanity’s Last Exam”（HLE）介绍

重磅！阿里巴巴开源自家首个MoE技术大模型：Qwen1.5-MoE-A2.7B，性能约等于70亿参数规模的大模型Mistral-7B

overflow：hidden清除浮动的一个简单的列子

DeepSeekAI开源国产第一个基于混合专家技术的大模型：DeepSeekMoE-16B，未来还有1450亿参数的MoE大模型

可能是史上最强大的AI Agent！OpenAI重磅更新：整合了多模态、外部访问、数据分析后的GPT-4更像是AI Agent了！

OpenAI发布新一代向量大模型，接口已经更新到text-embedding-3-large，embedding长度升级，价格最高下降5倍！

你成功啦！！！

Java入门基础笔记-5

OpenAI开源最新的3D物体生成预训练模型——Point-E

IE6的兼容问题

Java入门基础笔记-3

Java入门基础笔记-10

PandasTutor——一个用于可视化pandas操作的神器

重磅！GPT-3.5可以微调了！OpenAI发布GPT-3.5 Turbo微调接口

最新博客