原创博客

原创AI技术博客

探索人工智能与大模型最新资讯与技术博客，涵盖机器学习、深度学习、自然语言处理等领域的原创技术文章与实践案例。

排序方式

CNN经典算法之Inception V1（GoogLeNet）

GoogLeNet是谷歌在2014年提出的一种CNN深度学习方法，它赢得了2014年ILSVRC的冠军，其错误率要低于当时的VGGNet。与之前的深度学习网络思路不同，之前的CNN网络的主要目标还是加深网络的深度，而GoogLeNet则提出了一种新的结构，称之为inception。GoogLeNet利用inception结构组成了一个22层的巨大的网络，但是其参数却比之前的如AlexNet网络低很多。是一种非常优秀的CNN结构。

2019/05/31 20:22:255,221

#GoogLeNet #Inception

重磅数据集分享：大规模多模态语料库之悟道数据集（WuDaoCorpora 2.0）

前几天，北京智源人工智能研究院引入了一个名为WuDaoMM的大规模多模态语料库，总共包含超过6.5亿对图像-文本。具体来说，约有6亿对数据是从图像和标题呈现弱相关的多个网页中收集的，另外5000万对强相关的图像-文本是从一些高质量的图片网站中收集的。

2022/03/24 09:17:395,234

#数据集

考虑价格和促销影响的销售预测算法实践

这是一篇来自Towards Data Science上面的一篇个人实践分享，主要是针对销量进行预测。一般来说，销量受到价格、季节等因素影响较大。这里就是考虑这些因素进行的一个实践。值得大家一试。这里我们翻译一下，并对其中的某些工作做一些简单的解释。

2020/02/15 18:16:565,251

#Prophet #python

深度学习技巧之Batch Normalization

Batch Normalization是深度学习中最重要的技巧之一。是由Sergey Ioffe和Christian Szeged创建的。Batch Normalization使超参数的搜索更加快速便捷，也使得神经网络鲁棒性更好。本篇博客将简要介绍相关概念和原理。

2019/08/18 15:52:575,268

#coursera #深度学习

用python生成随机数的几种方法

本篇博客主要讲解如何从给定参数的的正态分布/均匀分布中生成随机数以及如何以给定概率从数字列表抽取某数字或从区间列表的某一区间内生成随机数，按照内容将博客分为3部分，并附上代码。

2019/03/27 21:13:175,381

#Python #随机数生成

ItemCF--Python

基于项目最近邻的协同过滤算法，面向的是隐偏好数据，数据格式为<userid,itemid>，测试算法的指标为precision和recall

2016-06-06 15:09:015,430

#个性化推荐

TFboys：使用Tensorflow搭建深层网络分类器

使用Tensorflow的高级API - tf.contrib.learn 搭建一个DNN分类器

2017/03/08 09:53:515,432

#DNN #Tensorflow

大语言模型训练之前，数据集的处理步骤包含哪些？以LLaMA模型的数据处理pipeline（CCNet）为例

大语言模型的训练是一个十分复杂的技术，不仅涉及到模型的开发与部署，还涉及到数据的获取。与常规的算法模型不同的是，大语言模型通常需要大量的数据处理步骤。本文是根据英国一位自动工程师总结的大语言模型训练之前的数据处理步骤和决策过程。

2023/04/24 22:50:025,435

#大语言模型 #数据处理

Android开发入门基础知识——Intent详解

Intent是Android中通信的组件。这篇博客将详细讲述什么是Intent及其用法。

2017/11/08 11:16:255,436

#Android #移动开发

大模型评测基准AIME 2024介绍

2024年，美国数学邀请赛（AIME）成为评估大型语言模型（LLM）数学推理能力的重要基准。AIME是一项备受尊崇的考试，包含15道题，考试时间为3小时，旨在考察美国顶尖高中生在各类数学领域的复杂问题解决能力。

2025/08/11 16:56:235,474

#SWE-Bench #大模型编程能力

Dask的本地集群配置和编程

Dask提供了多种分布式调度器，当缺少多台服务器时候，也可以通过本地集群来实现单机分布式的计算。这篇博客主要就是介绍如何实现Dask的单机分布式调度器。第一小节是简介，第二节是单机调度器的简写版本，第三节是单机调度器的完整版本，第四节是使用的一些示例。

2020/03/31 14:25:105,478

#Dask #Python

国产代码补全预训练模型——清华大学CodeGeeX发布！

随着NLP预训练模型的发展，大语言模型在各个领域的作用也越来越大。几个月前，GitHub基于OpenAI的GPT-3训练的Copilot效果十分惊艳，可惜现在已经开始收费。而最近，清华大学也发布了一个代码补全神器——CodeGeeX。

2022/10/02 14:22:355,495

#代码补全 #预训练

交集选择器

2018/10/04 21:45:265,543

#交集选择器

层次狄利克雷过程简介（Hierarchical Dirichlet Process， HDP）

2018/09/29 16:32:095,601

softmax作为输出层激活函数的反向传播推导

softmax作为多标签分类中最常用的激活函数，常常作为最后一层存在，并经常和交叉熵损失函数一起搭配使用。这里描述如何推导交叉熵损失函数的推导问题。

2019/08/25 15:09:335,645

#python #人工智能

平衡二叉树（Balanced Binary Tree）

平衡二叉树（Balanced Binary Tree）是二叉树（Binary Tree）中最重要的一种树结构。由于它保证了一个良好的二叉树形结构，使得其查找、搜索和删除等操作的效率大大提高，是应用最广泛的二叉树。

2018/10/25 17:10:445,649

#二叉树 #数据结构

二叉树（Binary Tree）

二叉树数据结构中一类重要的数据结构，也是树表家族最为基础的结构。二叉树每个节点最多具有两个子节点。本篇博客将简述二叉树原理和应用。

2018/10/25 17:12:105,696

#二叉树 #数据结构

大模型驱动的自动代理（AI Agent）：将语言模型的能力变成通用能力的一种方式——来自OpenAI安全团队负责人的解释与观点

当前大模型本质是一种大语言模型（Large Language Models, LLM)，其核心能力是对语言的处理。良好的意图识别和文本生成能力让LLM超越了之前的模型，有了巨大的实用价值。但是，现实问题涉及了很多超越语言模型之外的能力，如基于最新数据的文本摘要、向用户提供实时数据分析和可视化结果、为代码提供debugging等。目前，让LLM解决这些问题的一个最有前景的方向就是建立大模型驱动的自动代理。也就是让LLM作为核心控制者来学会使用不同工具，进而完成最终任务。

2023/07/20 16:35:005,740

#AIAgent #LLM

OpenAI最新的推理大模型o1与GPT-4o有什么区别？o1一定比o1 mini更强吗？一文总结OpenAI对o1模型的官方答疑

OpenAI的o1模型是当前最强大的具有超强推理能力的大语言模型。但是，o1模型本身的能力如何，o1版本和o1-mini版本模型的差异在哪等似乎都很不清晰。为此，OpenAI在Twitter上举办了一次AMA（Ask me anything）活动，解答了很多大家关心的问题。在这篇博客中，我们根据这个讨论结果总结了一下其中比较重要的信息供大家参考。

2024/09/16 19:37:215,755

#o1-mini #o1-preview

R语言数据库操作（不定时更新）

R的数据库连接、操作

2017/04/05 21:27:045,825

#mysql #R

TF-IDF的java实现(权重排序显示)

2017-01-07 14:15:165,883

#java实现 #TF-IDF

Dirichlet Tree Distribution（狄利克雷树分布）

狄利克雷分布作为多项式分布的先验大家应该比较熟悉了。这里介绍另外一种Dirichlet树结构的分布，也可以作为多项式分布的先验，但却更加灵活

2017/02/06 21:17:005,892

#Dirichlet #分布

亚马逊最新发布Feature Store简介

在2020年的亚马逊reInvent发布会上，亚马逊正式发布了一项新的服务，即Amazon SageMaker Feature Store，中文简介是适用于机器学习特征的完全托管的存储库。 Feature Store是这两年兴起的另一个关于人工智能系统的基础设施，应该也是未来几年最重要的人工智能基础设施之一。本文将介绍一下Feature Store是什么以及为什么很多企业开始推广这个东西。

2021/06/11 21:22:505,934

#AI #FeatureStore

开源版本的GPT-3来临！Meta发布OPT大语言模型！

关注深度学习或者NLP的童鞋应该都知道openAI的GPT-3模型，这是一个非常厉害的模型，在很多任务上都取得了极其出色的成绩。然而，OpenAI的有限开放政策让这个模型的应用被限定在很窄的范围内。甚至由于大陆不在OpenAI的API开放国家，大家几乎都无法使用和体验。而五一假期期间，FaceBook的研究人员Susan Zhang等人发布了一个开源的大预言模型，其参数规模1750亿，与GPT-3几乎一样。

2022/05/05 23:00:566,003

#NLP #深度学习