OpenAI在其官方GitHub上公开了一个最新的开源Python库:tiktoken,这个库主要是用力做字节对编码的。相比较HuggingFace的tokenizer,其速度提升了好几倍。
时间序列数据处理中的相关数学概念
编程项目构建工具简介
使用深度学习(逻辑回归)处理图像识别的问题
100天搞定机器学习(100-Days-Of-ML)(一)数据预处理
Dirichlet Multinomial Mixture Model做短文本聚类(包括代码)
计算机视觉领域的六大任务简介
三层Dirichlet 过程(非参贝叶斯模型)-来自Machine Learning
SCI/SCIE/SSCI/期刊查询验证方法
推荐系统之概率矩阵分解的详细推导过程(Probabilistic Matrix Factorization,PMF)
DeepGraph Library(DGL)发布了0.81版本
Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
回归模型中的交互项简介(Interactions in Regression)
贝塔分布(Beta Distribution)简介及其应用
矩母函数简介(Moment-generating function)
使用R语言进行K-means聚类并分析结果
普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
H5文件简介和使用
深度学习技巧之Early Stopping(早停法)
Wishart分布简介
stata 用outreg2输出回归结果