Google Research 简介

Google Research

Google Research是谷歌公司的研究部门,致力于推动计算机科学、机器学习、人工智能等相关领域的技术发展。该团队由研究人员和工程师组成,共同解决复杂问题并开发新技术,有可能影响数百万人的生活。需要注意的是,本文所说的Google Research是谷歌自己的研究机构和团队,不包含Deep Mind。因为Deep Mind是谷歌2015年收购的研究机构。相比较谷歌自家成立的研究团队更加独立。

Google Research成立于2003年,即谷歌公司首次公开募股(IPO)后不久。多年来,谷歌研究已成为世界上最受尊重和具有影响力的研究组织之一。

Google Research是非常庞大的组织,尽管官方没有公布属于Google Research的雇员总数。但是根据分布在全球的研究机构和发布的学术成果看,这部分的人数非常多。目前,Google Research由分布在全球几十个研究所的23个研究小组组成。每个研究小组可能在多个不同的研究所都有团队成员,形成了一个庞大的研究所和研究团队互相交叉的组织形式(而这一点与华为公开的研发组织形式类似,也是国内很多高校,例如合肥工业大学管理学院的研究组织形式类似,兼顾了优秀成员的归属地和公司管理的双重诉求)。本文将从不同的方面对Google Research做一个简单的介绍。



Google Research研究小组

Google Research内部包括了很多不同的研究团队(官方称为teams,也就是研究小组)。这些研究团队有不同的侧重点,分布在全球各地。目前,Google官方公布的研究小组共23个,除了印度研究实验室(India Research Lab)外,其他小组都是按照兴趣或者研究方向定的。印度研究实验室的目标是为计算机科学的基本进展做出贡献,并应用他们的研究来解决大问题,为印度、谷歌和世界各地的社区带来影响。Google Research所有的研究小组的名称如下(排序是按照研究小组英文名首字母顺序排序):

序号研究小组英文名研究小组中文名研究小组官方介绍链接
1AI fundamentals and applications人工智能的基本原理和应用https://research.google/teams/ai-fundamentals-applications/
2Algorithms and optimization算法和优化https://research.google/teams/algorithms-optimization/
3Applied science应用科学https://research.google/teams/applied-science/
4Blueshift蓝移https://research.google/teams/blueshift/
5Brain大脑https://research.google/teams/brain/
6Cloud AI云人工智能https://research.google/teams/cloud-ai/
7Cloud networking云计算网络https://research.google/teams/cloud-networking/
8Connectomics连接组学https://research.google/teams/connectomics/
9Global networking全球网络https://research.google/teams/global-networking/
10Graph mining图谱挖掘https://research.google/teams/graph-mining/
11Health健康https://research.google/teams/health/
12India Research Lab印度研究实验室https://research.google/teams/india-research-lab/
13Language语言学https://research.google/teams/language/
14Market algorithms市场算法https://research.google/teams/market-algorithms/
15Mural壁画https://research.google/teams/mural/
16Network infrastructure网络基础设施https://research.google/teams/network-systems/
17Operations research运营研究https://research.google/teams/operations-research/
18Perception视觉https://research.google/teams/perception/
19Responsible AI负责任的人工智能https://research.google/teams/responsible-ai/
20Robotics机器人学https://research.google/teams/robotics/
21Security, privacy and abuse安全、隐私和滥用https://research.google/teams/security-privacy-abuse/
22Software engineering and programming languages软件工程和编程语言https://research.google/teams/software-engineering-and-programming-languages/
23System performance系统性能https://research.google/teams/system-performance/

部分研究小组的具体研究方向如下:

  • Brain Team:即著名的谷歌大脑团队,关注机器智能方面。
  • Responsible AI:负责任的人工智能和以人为本的技术(RAI-HCT)团队的任务是进行研究开发方法、技术和最佳实践,以确保人工智能系统是负责任地建立的。
  • AI Fundamentals and Applications:团队致力于为理论和算法、机器学习、新闻、语音和其他数据驱动的学科中的计算问题寻找解决方案,并对谷歌的产品和科学进步产生影响。该团队专注于两个工具:软件库,将研究成果转化为产品和服务,以及出版物,让社区了解这些工作。
  • Algorithms and optimization:团队由多个重叠的研究小组组成,致力于图形挖掘、大规模优化和市场算法。与整个谷歌的团队密切协作,使广告、搜索、YouTube、播放、基础设施、地理、社交、图像搜索、云计算等领域受益。在进行这些合作的同时,还进行与机器学习的算法基础、分布式优化、经济学、数据挖掘和数据驱动的优化有关的研究。研究人员既参与长期研究工作,也参与我们技术的直接应用。近的研究兴趣包括在线广告分配问题,大规模图形挖掘的分布式算法,广告交易所的机制设计,以及广告拍卖的稳健和动态定价。
  • Applied science:计算机科学和自然科学是相辅相成的:一个方面的突破可以导致另一个方面的显著进步。谷歌Applied science小组的目标是使这两个领域相互促进。应用科学有四个主要工作。量子计算,谷歌加速科学,气候和能源,以及科学计算工具。
  • India Research Lab:印度研究实验室并不是按照研究方向划分的研究小组,是十分独特的研究团队。根据官网的介绍,他们的研究兴趣十分广发,包含了很多不同的内容。而目标似乎是与取得”影响力“?官网说明了这个团队的目的是在未来五年内在三个维度获得影响力,包括科学影响力、社会影响力和产品影响力。根据ChatGPT的回答,谷歌的这个研究所的目的主要是研究各种问题来服务印度,包括人工智能、健康等。

具体每个小组的情况大家可以参考上面的链接了解更多。



Goolge Research研究所

前面我们已经介绍了Google Research的研究小组。但是需要说明的是,这些研究小组并不都是在一个地点办公,一个团队可能分布在全球不同的办公地点,也就是Google Research的研究所。截止2023年3月4日,Google Research官方公布的研究所共20个,分布在全球各个地区。



所有的研究所列表如下:

区域国家地点部分团队展示网站
北美地区美国(US)亚特兰大(Atlanta)Brain Team, Resonsible AIhttps://research.google/locations/atlanta/
北美地区美国(US)剑桥(Cambridge)AI fundamentals and applications,Brain Team, Resonsible AIhttps://research.google/locations/cambridge/
北美地区美国(US)洛杉矶(Los Angeles)暂无信息暂无信息
北美地区美国(US)西雅图 & 柯克兰(Seattle & Kirkland)Brain Team, Resonsible AI, Language, Perceptionhttps://research.google/locations/montreal/
北美地区美国(US)纽约(New York)Algorithms & Optimization,Global Networkinghttps://research.google/locations/new-york/
北美地区美国(US)匹兹堡(Pittsburgh)Brain Team, Perceptionhttps://research.google/locations/pittsburgh/
北美地区美国(US)旧金山湾区(San Francisco Bay Area)山景城总部包含各个团队https://research.google/locations/sf-bay-area/
北美地区加拿大(Canada)多伦多(Toronto)Brain Team, Responsible AIhttps://research.google/locations/seattle-kirkland/
北美地区加拿大(Canada)蒙特利尔(Montreal)Brain Team, Resonsible AI, Languagehttps://research.google/locations/toronto/
欧洲,中东和非洲加纳(Ghana )Accra(阿克拉)Brain Team, Responsible AIhttps://research.google/locations/accra/
欧洲,中东和非洲荷兰(Haarlem)Amsterdam(阿姆斯特丹)Brain Teamhttps://research.google/locations/amsterdam/
欧洲,中东和非洲德国(Germany)Berlin(柏林)Brain Team, Languagehttps://research.google/locations/berlin/
欧洲,中东和非洲德国(Germany)慕尼黑(Munich)Language, Software engineering and programming languageshttps://research.google/locations/munich/
欧洲,中东和非洲以色列(Israel)以色列(Israel)Cloud Networking, Perceptionhttps://research.google/locations/israel/
欧洲,中东和非洲英国(England)伦敦(London)Graph Mining, Health, Muralhttps://research.google/locations/london/
欧洲,中东和非洲法国(France)巴黎(Paris)Operations Research, Algorithms & Optimizationhttps://research.google/locations/paris/
欧洲,中东和非洲瑞士(Switzerland)苏黎世(Zürich)Global Networking, Market Algorithmshttps://research.google/locations/zurich/
亚太澳大利亚(Australia)澳大利亚(Australia)System Performance, Security, Privacy and Abusehttps://research.google/locations/australia/
亚太印度(India)
印度(India)
India Research Labhttps://research.google/locations/india/
亚太日本(Japan)东京(Tokyo)Brain Team, Languagehttps://research.google/locations/tokyo/

可以看到,虽然谷歌在全球建立了各种研究所。但是最主要的分布还是在美国和欧洲。而亚太总共三个研究所,除了东京以外,其它都是以国家命名的研究机构。而谷歌在国内保留的主要是销售和市场团队。需要注意的是,上述研究所有大有小,每一个研究所包含的研究团队并没有完全列举,需要了解详细信息的可以根据提供的链接进一步了解。



Google Research的重大研究成果

谷歌研究的一些最重要的贡献包括TensorFlow的开发,它是一种用于机器学习的开源软件库,以及Google翻译的创建,该翻译工具使用先进的机器学习技术来翻译不同语言之间的文本。该研究部门还在自然语言处理、计算机视觉和机器人领域做出了重要贡献。

Google Research在机器学习、自然语言处理、计算机视觉和机器人领域取得了许多开创性的进展。该团队还与学术机构和其他组织合作,推动这些领域的技术发展。

谷歌研究分为多个研究组,每个组都有自己的专业领域和研究重点。其中包括谷歌大脑团队,专注于深度学习和神经网络,谷歌AI团队,专注于通用人工智能研究,以及谷歌健康团队,应用机器学习于医疗保健。

其实,根据前面的描述,大家也知道,Google Research的研究团队太多,成果也很多。在这几年中,除去OpenAI非常成功的AI成果外。深度学习领域的很多技术,如Google Brain团队做的图片识别、谷歌团队在ImageNet持续的挑战、基于神经网路的机器翻译等。其中,最著名的可能是2012年Google Brain团队做的Cat Experiment。那年,吴恩达(Andrew Ng)带领研究团队训练了一个神经网络,利用上百万张图片教会模型识别猫。它最大的意义是让人们认识到神经网络可以学习识别数据中复杂的模式。推动了机器学习的进步。

2022年末,OpenAI推出的ChatGPT让大家认识到它可以替代搜索引擎做很多事情。而谷歌在这类技术上应用的落后让大家觉得Google在这方面的研究过于保守。

Google Research发布的大模型列表

BERT

3.4

亿个参数

2018-10-11

发布时间

免费商用授权

预训练结果开源

T5

110.0

亿个参数

2019-10-23

发布时间

预训练结果开源

Switch Transformer

16000.0

亿个参数

2021-01-11

发布时间

预训练结果开源

V-MoE

150.0

亿个参数

2021-06-10

发布时间

预训练结果开源

GLaM

12000.0

亿个参数

2021-12-13

发布时间

预训练结果开源

PaLM

5400.0

亿个参数

2022-04-05

发布时间

不开源

预训练结果开源

PaLM-Coder

5400.0

亿个参数

2022-04-5

发布时间

不开源

预训练结果开源

UL2

200.0

亿个参数

2022-05-10

发布时间

预训练结果开源

Imagen

20.0

亿个参数

2022-05-23

发布时间

预训练结果开源

Flan-T5

110.0

亿个参数

2022-10-20

发布时间

预训练结果开源

ViT-22B

220.0

亿个参数

2023-02-10

发布时间

预训练结果开源

Flan-UL2

200.0

亿个参数

2023-03-03

发布时间

预训练结果开源

PaLM-E

5620.0

亿个参数

2023-03-06

发布时间

预训练结果开源

PaLM 2

3400.0

亿个参数

2023-05-10

发布时间

不开源

预训练结果开源

PaLM2-S

0.0

亿个参数

2023-05-10

发布时间

不开源

预训练结果开源

DoReMi

80.0

亿个参数

2023-05-17

发布时间

预训练结果开源

Gemma 7B

70.0

亿个参数

2024-02-21

发布时间

免费商用授权

预训练结果开源

Gemma 2B

20.0

亿个参数

2024-02-21

发布时间

免费商用授权

预训练结果开源

Gemma 2B - It

20.0

亿个参数

2024-02-21

发布时间

免费商用授权

预训练结果开源

Gemma 7B - It

20.0

亿个参数

2024-02-21

发布时间

免费商用授权

预训练结果开源

Gemma 1.1-7B-IT

70.0

亿个参数

2024-04-06

发布时间

免费商用授权

预训练结果开源

Gemma 1.1-2B-IT

20.0

亿个参数

2024-04-06

发布时间

免费商用授权

预训练结果开源

CodeGemma-7B

70.0

亿个参数

2024-04-09

发布时间

免费商用授权

预训练结果开源

CodeGemma-7B-IT

70.0

亿个参数

2024-04-09

发布时间

免费商用授权

预训练结果开源

CodeGemma-2B

20.0

亿个参数

2024-04-09

发布时间

免费商用授权

预训练结果开源

RecurrentGemma-2B

27.0

亿个参数

2024-04-09

发布时间

免费商用授权

预训练结果开源

RecurrentGemma-2B-IT

27.0

亿个参数

2024-04-09

发布时间

免费商用授权

预训练结果开源