Original Blog

Original AI Tech Blogs

Explore the latest AI and LLM news and technical articles, covering original content and practical cases in machine learning, deep learning, and natural language processing.

Sort by

Sort by Date Sort by Views

深度学习库

2017/05/08 08:57:402,696

#<span class='blog_tag'><a href='blog_list #tag

《Effective Java 第三版》笔记之二当构造参数很多的时候考虑使用builder

本文是Effective Java第三版笔记的第二个之当构造参数很多的时候考虑使用builder

2018/09/17 22:15:332,680

#effectivejava #java

Llama3相比较前两代的模型（Llama1和Llama2）有哪些升级？几张图简单总结Llama3的训练成本、训练时间、模型架构升级等情况

Llama3是MetaAI开源的最新一代大语言模型。一发布就引起了全球AI大模型领域的广泛关注。这是MetaAI开源的第三代大语言模型，也是当前最强的开源模型。但相比较第一代和第二代的Llama模型，Llama3的升级之处有哪些？本文以图表的方式总结Llama3的升级之处。

2024/04/21 20:31:562,678

#Llama3 #Llama3-400B

Original AI Tech Blogs

深度学习库

《Effective Java 第三版》笔记之二当构造参数很多的时候考虑使用builder

Llama3相比较前两代的模型（Llama1和Llama2）有哪些升级？几张图简单总结Llama3的训练成本、训练时间、模型架构升级等情况

Batch Normalization应该在激活函数之前使用还是激活函数之后使用？

大语言模型的技术总结系列一：RNN与Transformer架构的区别以及为什么Transformer更好

初学者搭建C语言开发环境

12倍推理速度提升！Meta AI开源全新的AI推理引擎AITemplate

最新发布！截止目前最强大的最高支持65k输入的开源可商用AI大模型：MPT-7B！

网络爬虫需要掌握的基础知识

国产大模型进展神速！清华大学NLP小组发布顶尖多模态大模型：VisCPM，支持文本生成图片与多模态对话，图片理解能力优秀！

TensorRT-LLM：英伟达推出的专为提升大模型推理速度优化的全新框架

绝对路径

Targeted Topic Modeling for Focused Analysis(TTM的理解)

OpenAI官方Prompt教程：如何让ChatGPT扮演不同角色，完成教学任务

后代选择器

大模型评测的新标杆：超高难度的“Humanity’s Last Exam”（HLE）介绍

开源王者！全球最强的开源大模型Llama3发布！15万亿数据集训练，最高4000亿参数，数学评测超过GPT-4，全球第二！

数据科学的Python——keras备忘录发布，含Keras的各种使用样例

网络爬虫中URLConnection的使用[以科学网为例]

平衡二叉树之红黑树（Red-Black Tree）简介及Java实现

Transformer蓝图：Transformer 神经网络架构的综合指南——万字长文、20多个图片介绍大语言模型主流架构Transformer的发展历史、现状和未来结果

重磅！苹果官方发布大模型框架：一个可以充分利用苹果统一内存的新的大模型框架MLX，你的MacBook可以一键运行LLaMA了

TEST

盒模型

深度学习库

《Effective Java 第三版》笔记之二 当构造参数很多的时候考虑使用builder

Llama3相比较前两代的模型（Llama1和Llama2）有哪些升级？几张图简单总结Llama3的训练成本、训练时间、模型架构升级等情况

Batch Normalization应该在激活函数之前使用还是激活函数之后使用？

大语言模型的技术总结系列一：RNN与Transformer架构的区别以及为什么Transformer更好

初学者搭建C语言开发环境

12倍推理速度提升！Meta AI开源全新的AI推理引擎AITemplate

最新发布！截止目前最强大的最高支持65k输入的开源可商用AI大模型：MPT-7B！

网络爬虫需要掌握的基础知识

国产大模型进展神速！清华大学NLP小组发布顶尖多模态大模型：VisCPM，支持文本生成图片与多模态对话，图片理解能力优秀！

TensorRT-LLM：英伟达推出的专为提升大模型推理速度优化的全新框架

绝对路径

Targeted Topic Modeling for Focused Analysis(TTM的理解)

OpenAI官方Prompt教程：如何让ChatGPT扮演不同角色，完成教学任务

后代选择器

大模型评测的新标杆：超高难度的“Humanity’s Last Exam”（HLE）介绍

开源王者！全球最强的开源大模型Llama3发布！15万亿数据集训练，最高4000亿参数，数学评测超过GPT-4，全球第二！

数据科学的Python——keras备忘录发布，含Keras的各种使用样例

网络爬虫中URLConnection的使用[以科学网为例]

平衡二叉树之红黑树（Red-Black Tree）简介及Java实现

Transformer蓝图：Transformer 神经网络架构的综合指南——万字长文、20多个图片介绍大语言模型主流架构Transformer的发展历史、现状和未来结果

重磅！苹果官方发布大模型框架：一个可以充分利用苹果统一内存的新的大模型框架MLX，你的MacBook可以一键运行LLaMA了

TEST

盒模型

《Effective Java 第三版》笔记之二当构造参数很多的时候考虑使用builder