正在播放:[4.1.5]--4.5语音交互的技术难点
课程目录

课程概述
本课程是教育部-微软产学合作协同育人项目成果,课程面向大学生和社会公众,结合社会热点和算法实践项目,介绍人工智能技术的基本概念、发展历史、经典算法、应用领域和对人类社会的深远影响,展示信息社会各领域中人工智能的应用发展前景,为大学生和社会公众提供一个深入理解人工智能的入门基础。

本课程结合北京大学跨学科综合优势,加强与微软亚洲研究院人工智能研究人员的合作,将人工智能技术的原理、应用和前景融入各门基础自然科学和社会人文科学中,以鲜活生动的案例加深对人工智能技术的理解。

慕课课程的讲解部分还邀请了微软亚洲研究院的人工智能研究专家,通过访谈形式,展现科学、技术、工程和商业等各个领域的专家对人工智能的理解和体会。课程注重算法实践,通过5个相对独立的人工智能典型应用项目,采用微软和其他开源项目提供的人工智能开发基础设施,结合丰富的应用数据,让学生能经过一段时间的学习,学习到成效显著且生动有趣的人工智能算法应用。





洪小文,微软亚洲研究院院长

洪小文博士现任微软全球资深副总裁,微软亚太研发集团主席,兼微软亚洲研究院院长,全面负责推动微软在亚太地区的科研及产品开发战略,以及与中国及亚太地区学术界的合作。

洪小文博士于1995年加入微软公司。2004年,他加入微软亚洲研究院并担任副院长,2007年升任微软亚洲研究院院长。2005年至2007年间,洪博士创立并领导了微软搜索技术中心(STC),该中心负责微软搜索产品(必应)在亚太的开发工作。2014年洪博士兼任微软亚太研发集团主席。

在加入微软亚洲研究院之前,洪博士是微软公司自然交互服务部门的创始成员和架构师,除了全面负责屡获殊荣的微软语音服务器产品、自然用户界面平台以及微软协助平台的架构及技术工作,他还负责管理和交付统计学习技术和高级搜索。洪博士于1995年加入微软研究院美国总部任高级研究员,并为微软的SAPI和语音引擎技术做出了突出贡献。此前,洪博士曾任职于苹果公司,带领团队研发出了苹果中文译写器。

洪小文博士是电气电子工程师学会院士(IEEE Fellow),微软杰出首席科学家和国际公认的语音识别专家。洪博士在国际著名学术刊物及大会上发表过百余篇学术论文。他参与合著的《语音技术处理》(Spoken Language Processing)一书被全世界多所大学采用为语音技术教学课本。另外,洪博士在多个技术领域拥有36项专利发明。

洪小文博士毕业于台湾大学,获电机工程学士学位,之后在卡内基梅隆大学深造,先后获得计算机硕士及博士学位。





刘铁岩,微软亚洲研究院副院长

刘铁岩博士,人工智能领域的国际知名学者。现任微软亚洲研究院副院长,国际电子电气工程师学会(IEEE)院士,美国计算机学会(ACM)杰出会员,美国卡内基梅隆大学(CMU)客座教授,英国诺丁汉大学荣誉教授,中国科技大学、中山大学、南开大学博士生导师。

刘博士的研究兴趣包括:人工智能、机器学习、信息检索、数据挖掘等。他的先锋性工作促进了机器学习与信息检索之间的融合,被国际学术界公认为“排序学习”领域的代表人物,在网络搜索和计算广告学等方向取得了卓越的学术成果。他在该领域的学术论文已被引用万余次,并受斯普林格(Springer)出版社之邀撰写了该领域的首部学术专著(并成为Springer计算机领域华人作者的十大畅销书之一)。

近年来,刘博士在博弈机器学习、深度学习、增强学习、分布式机器学习、符号学习等方面也颇有建树,发表了百余篇学术论文,被他引万余次。他的研究工作多次获得最佳论文奖、最高引用论文奖、研究突破奖,被广泛应用在微软的产品和在线服务中。他的团队发布了微软分布式机器学习工具包(DMTK)、微软图引擎(Graph Engine)等知名项目开源。

他曾受邀担任了包括SIGIR、WWW、NIPS、KDD、AAAI、ACL等在内的十余个顶级国际会议的组委会主席、程序委员会主席、或领域主席;以及包括ACM TOIS、ACM TWEB、Neurocomputing等在内的国际期刊的副主编。他还是中国计算机学会(CCF)高级会员、杰出演讲者、学术工委,中文信息学会信息检索专委会副主任。





张益肇,微软亚洲研究院副院长

张益肇博士于1999年7月加盟微软亚洲研究院,从事语音方面的研究工作。 现任微软亚洲研究院副院长,负责技术战略部。履任微软亚洲研究院新职位之前,张博士任微软亚洲工程院副院长,是2003年工程院的创建者之一。在工程院,他带领团队开发Windows Mobile和 Windows的产品,并建立起一支多学科技术产品孵化的团队。在加入工程院之前,张博士曾担任研究院语音组主任研究员和高校关系总监,他的团队成功的把汉语普通话语音识别引擎转化到了中文版Office和Windows中。

他曾是 Nuance Communications 公司研究部的创始人之一,该公司是电信领域自然语言界面研究的先驱。在 Nuance 工作期间,他曾从事自信度分析,声学建模,语音检测等领域的研究工作。他领导研究人员开发了 Nuance 产品的日文版本,这是世界上第一个开放式日语语音识别系统。他还曾在麻省理工的林肯实验室开发出了新的语音识别算法,在东芝 ULSI 研究中心发明了一种新的电路优化技术,在通用电气公司的研发中心开展了模式识别方面的研究。

张博士毕业于麻省理工学院,获电气工程和计算机科学学士、硕士和博士学位。他在国际著名的杂志和学术会议上发表了多篇关于语音技术和机器学习方面的论文,是多项专利的拥有者。





周明,微软亚洲研究院副院长

周明博士,微软亚洲研究院副院长、国际计算语言学协会(ACL)候任主席、中国计算机学会理事、中文信息技术专委会主任、术语工作委员会主任、中国中文信息学会常务理事、哈尔滨工业大学、天津大学、南开大学、山东大学等多所学校博士导师。

周明博士1985年毕业于重庆大学,1991年获哈尔滨工业大学博士学位。1991-1993年清华大学博士后,随后留校任副教授。1996-1999访问日本高电社公司领导中日机器翻译研究。他是中国第一个中英翻译系统CEMT-I(哈工大1989年)、日本最有名的中日机器翻译产品J-北京(日本高电社1998年)的研制者。

1999年,周明博士加入微软亚洲研究院,不久开始负责自然语言研究组。他带领团队进行了微软输入法、英库词典(必应词典)、中英翻译、微软中国文化系列(微软对联、微软字谜、微软绝句)等重要产品和项目的研发,并对微软Office、必应搜索、Windows等产品中的自然语言技术做出了重要贡献。近年来,周明博士领导研究团队与微软产品组合作开发了微软小冰(中国)、Rinna(日本)、Zo(美国)等聊天机器人系统。

周明博士发表了120余篇重要会议和期刊论文(包括50篇以上的ACL文章),拥有国际发明专利40余项。他多年来通过微软与中国和亚太地区的高校合作计划,包括微软-高校联合实验室、微软实习生计划、微软-高校联合培养博士生计划、青年教师铸星培养计划,与高校和学术组织联合举办暑期学校和学术会议等多种形式,对推动自然语言处理在中国和亚太的卓越发展做出了杰出贡献。





潘天佑,微软亚洲研究院副院长

潘天佑博士现任微软亚洲研究院副院长,全面负责微软亚洲研究院与亚太地区高校、研究机构及政府的学术交流和研究合作。他建立了一系列战略方针、积极探索商业机会,并构建了针对不同层面的多种学术交流和人才培养项目,以加强微软亚洲研究院与学术界之间的伙伴关系。 

潘天佑博士还负责微软亚洲研究院与企业、投资机构和政府部门的深度技术合作。作为微软亚洲研究院 “创新汇”负责人,潘天佑博士致力于制定共赢的企业合作战略,搭建跨行业的沟通平台,探讨在数字化转型的大潮中,如何以技术创新实现共同发展。

潘天佑博士拥有获得美国圣路易斯华盛顿大学(Washington University in St. Louis)电机工程博士学位。潘博士具有20余年计算机相关工作经验,曾成功创立两家专注于智能卡芯片和大规模银行系统的技术公司。潘天佑博士2005年至2007年曾任职微软亚洲研究院学术合作部。出于对人才培养和学术合作的激情,2012年潘天佑博士选择再次加入微软亚洲研究院。

潘天佑博士连续十年担任台湾圣约翰科技大学校董,义务授课并就计算机技术和高科技创业发表演讲。潘天佑博士同时是一名信息系统安全专家,拥有CISSP等相关工业认证。



显示全部 
 授课目标
本课程的目标,是为大学生和社会公众提供一个深入理解人工智能的入门基础,使学生初步了解人工智能技术的基本概念、发展历史、经典算法、应用领域和对人类社会的深远影响,从而打开学习人工智能的大门,为学生今后在人工智能相关领域进行深入研究奠定基础。



——准备好了吗?欢迎选修"人工智能与信息社会"!



 课程大纲
本课程分为8周,每周包括10个左右10分钟以内的视频课程。

1        新闻热点与身边的人工智能

1.1        家里的AI:扫地机器人/智能音箱/智能家居/教育/个人助手

1.2        语音识别/自动翻译:法庭速记/同声传译

1.3        图像识别:手机中的照片整理/美颜处理/安防

1.4        会下棋的人工智能:AlphaGo

1.5        自动驾驶/工业机器人:汽车/公交车/卡车

1.6        医疗健康:监测诊断

1.7        金融:智能投顾、智能客服、安防监控、金融监管

1.8        微软亚洲研究院院长洪小文博士寄语计算机教育

2        人工智能发展简史

2.1        什么是人工智能?

2.2        人工智能发展历史

2.3        人工智能经典问题(图灵测试,中文屋)

2.4        人工智能第一次浪潮:最早的神经元

2.5        人工智能第二次浪潮:专家系统

2.6        人工智能第三次浪潮:深度神经网络

2.7        访谈2-1(微软亚洲研究院刘铁岩副院长:历史)

2.8        访谈2-2(微软亚洲研究院刘铁岩副院长:热潮)

2.9        访谈2-3(微软亚洲研究院刘铁岩副院长:未来)

3        基于决策树和搜索的智能系统

3.1        实例1:读心术(建立二分查找的规则)

3.2        和人类一样的判断方式:专家系统

3.3        专家系统应用与发展

3.4        实例2:井字棋(决策树介绍)

3.5        双方零和完全信息博弈的搜索树

3.6        基于搜索树对局面进行估值决策

3.7        最大最小值法(Minimax)

3.8        Alpha-Beta剪枝

3.9        启发式搜索

3.10     从国际象棋到围棋

3.11 实际代码与运行结果

4        基于仿生算法的智能系统I

4.1        仿生算法简介

4.2        基因遗传算法(初始种群、遗传变异、评估淘汰)

4.3        实例3:拼图游戏

4.4        拼图的基因

4.5        遗传和变异

4.6        自然选择

4.7        实际代码与运行结果

5        基于神经网络的智能系统

5.1        神经元与神经网络

5.2        实例4:手写数字识别

5.3        构建网络参数

5.4        计算损失函数

5.5        通过优化器优化参数

5.6        反向传播

5.7        实际代码与运行结果

6        基于神经网络的智能系统II

6.1        监督学习和非监督学习

6.2        实例5:Flappybird(让人工智能学会玩游戏)

6.3        试错式学习

6.4        State-action-reward

6.5        价值判断:Q函数

6.6        遍尝百草:e-greedy

6.7        熟能生巧:持续更新Q函数

6.8        实际代码与运行结果

7        人工智能应用

7.1        图像识别与分类

7.2        医学影像分析

7.3        访谈7-1(微软亚洲研究院张益肇副院长:医疗+AI综述)

7.4        访谈7-2(微软亚洲研究院张益肇副院长:当前成就)

7.5        访谈7-3(微软亚洲研究院张益肇副院长:未来展望)

7.6        语音识别——个人助理(siri/google assistant/微软小冰小娜)

7.7        人脸识别和情感计算

7.8        访谈7-4(微软亚洲研究院周明副院长:自然语言处理综述)

7.9        访谈7-5(微软亚洲研究院周明副院长:当前成就)

7.10     访谈7-6(微软亚洲研究院周明副院长:未来展望)

7.11     自动驾驶

8        人工智能与人类社会未来

8.1        挑战:技术视角

8.2        挑战:人文视角

8.3        访谈8-1(微软亚洲研究院潘天佑副院长:AI各个领域发展)

8.4        伦理规范:社会层面

8.5        伦理规范:公共政策层面

8.6        访谈8-2(微软亚洲研究院潘天佑副院长:伦理规范的影响)

8.7        访谈8-3(微软亚洲研究院潘天佑副院长:人工智能人才培养)

8.8        科幻作品中的人工智能(影视作品:AI,Her,攻壳机动队,黑客帝国)

8.9        奇点理论:畅想未来