【新课预告】加州大学伯克利分校CS285《深度强化学习》学习小组成员招募

  • 2019年12月22日

他来了他来了,字幕君带着新课的授权来了!

2016年,日本垃圾处理公司Shitara Kousan引进了两台ZenRobotics的ZRR2机器人。他们说,两只机器人四只手臂,24小时不停转,每天处理2000吨垃圾,相当于48人的工作量。

第十七讲:分布式强化学习

110个国家和国际组织

第十一讲:基于模型的强化学习

看机器人的代号 (MAX-AI AQC-C) ,也想象得到,它曾经有过不少的先辈了。

6. 社区翻译志愿者持续招募中,如果对这门课程的翻译感兴趣,可以联系社长准备字幕翻译工作。

第十六讲:迁移学习与多任务学习

加入小组后获得2019 UC 伯克利 CS285 《深度强化学习》课件 PPT下载地址

即将在京郊延庆举办的

这次课程,一共有 21 讲,具体如下:

那时,受到机器人支配的主要是建筑废料。

安静的时候,它长这样:

第八讲:深度强化学习之Q函数

第十四讲:强化学习对控制的概率推断

一个中国与世界的交融平台

添加字幕君微信,备注“285翻译”报名加入翻译

那里得天独厚的生长环境,给了机器人修炼技能的养分。

除了气味,还有锋利的垃圾如菜刀、如玻璃,有害的垃圾如重金属、如油漆,都可能对工作人员造成伤害。

传送带跑起来分秒必争,两条机械手臂也不示弱。

是啊,如果不是每天在这样的环境里工作,大概也很难适应。

璀璨花千树,芳菲四月天

4月17日无人机拍摄的世园会园区夜景。新华社记者 陈晔华 摄

所以,在这个世界上,它是第一只专职负责垃圾分拣的协作机器人。

西班牙特内里费岛独有的野蓝蓟

2. 每学完一节课程,学员需在自行独立完成 Quiz 作业并在社区博客进行分享 

走出美国,看看外面的世界。就会发现这个家族并不孤单。

家族里的大前辈MAX-AI AQC,已经在2017离开家,去宾夕法尼亚州的垃圾回收公司Penn Waste工作了。

一呼一吸之间,每个动作都毫不费力。不由得相信,它就是为了分拣而生。

从4月29日起至10月7日

一曲创新与绿色的和谐乐章

第十讲:基于模型的规划

当然,MAX-AI一族向来拥有强大的视觉基因,快速扫过也看得清。

垃圾从入厂到出厂的每个环节,都是团队熟悉的日常。比如,分拣除了靠视觉,还有用密度来判别材质的NIHOT空气分离系统 (Air Separation System) 。

是“俏也不争春”的梅花?

作为一场人类与自然的精彩对话

4. 为保证社区的学习氛围,社长会根据课程完成情况和活跃程度对学员进行监督管理,如有必要,会定期清理不活跃或者长期潜水的学员;    

回到我国,生活垃圾才是更严酷的挑战。分类不足,导致许多垃圾得不到更恰当的处理,只得以填埋收场。

第二十一讲:信息理论,开放性问题探讨

你期望眼前是什么花?

△ 厨余垃圾里,发现了雨伞和菜刀

第一讲:课程介绍和概览

3. 学员可以根据自己的时间及兴趣,决定是否进行课后作业分享的公开课直播。 

第二讲:针对行为的监督学习

By 知乎答主“有道理”

现在强烈推荐这门课程!课程基本可以分为DRL介绍+模仿学习、model free、model based、Exploration+迁移+多任务+Meta-learning等四大部分,一共有四个很有趣的assignment(比春季的更好了)。如果你看过david silver的视频并且有机器学习的基础,那么至少你在model free部分是没问题的。秋季课程其实降低了对RL基础的要求,课上推导过程比较清晰。这门课后半model based部分恰好是对david silver等当前已有的课程、书籍里讲的比较少的内容的非常大的补充,不过这部分要求比较高。

120多个非官方参展方

第四讲:强化学习简介

来长城脚下、妫水河畔的

这样艰辛的工作,有机器人来分担就好了。

还是“似青似白天浓淡”的海棠?

和从前那些大块头不一样,5月刚刚发布的新版本,小到可以进入分拣室,进入狭窄的走道,可以和人类工作在一起。

第十三讲:变分推断和生成模型

第十五讲:逆向强化学习

MAX-AI便是一只垃圾分拣机器人,迅速判断哪是塑料瓶、哪是易拉罐、哪是纸,把它们送到该去的地方:

是“别后相思最多处”的樱花?

在这2019年的尾声,字幕君带着获得了加州大学伯克利分校 CS285 《深度强化学习》讲师@Sergey Levine正式授权汉化翻译,感兴趣的同学也可以报名参与志愿者翻译团队。

第三讲:TensorFlow 和神经网络简述

只是,那时的机器人很高很壮,很难和人类协作,工厂也需要为了它而改造流水线。

机智的你,可能已经发现了:就算四周成了垃圾桶,目标变小,机器人也能命中,不会把铝管扔进盛塑料瓶的桶,也不会扔到外面去。

第十八讲:探索(上)

7. 课程有一定难度,且有较多作业,希望学员一旦加入,能够克服困难,收获成长。

在跑男的大本营杭州,不到12年已有超过1700万吨垃圾被填埋,占满了原本预计24年才能用完的空间。以现在的速度,每三到四年就能填满一个西湖。

第十九讲:探索(下)

不怕恶臭,不会生病,不用休息。

字幕君深知一人坚持的不易,并想邀请热爱学习的你和诸多志同道合的小伙伴,以相互监督,共同进步的形式,一起研习这门新课程!

右边,就是机器人本人。刚刚得出的识别结果,立刻便转化成它的动作。吸起垃圾、瞄准目的地、发射:

在CS285这门课程中,Sergey Levine 教授将会深入浅出地讲解深度强化学习的背景理论知识、实现方式以及核心算法,并布置相应的家庭作业以帮助各位同学更好地巩固学习内容。

重点是,只要有条传送带搬运垃圾,机器人就可以工作了。它对场地没有特殊的要求,各种狭窄的空间都不排斥,也不需要为它去改造其他设备的结构。

首先这门课的质量非常好。课程反应了Sergey Levine和整伯克利RL的积累,独立于《RL Introduction》的教学体系自成一派。最可贵的是涵盖近1-2年RL最前沿的知识。这门课又难又深,但绝对是飞往RL前沿的航班。研究RL的同学万万不可错过啊。

众所周知,深度强化学习是人工智能发展的重大方向之一。熟悉深度强化学习背景知识的优秀人才倍受各大科研机构与公司青睐,不管是工业界还是学术界,深度强化学习都被视为实现通用人工智能最有可能的路径之一。因此,熟悉深度强化学习知识显得尤为重要。

空中俯瞰北京世园会园区(4月18日无人机拍摄)。新华社记者 陈晔华 摄

然而,这看似与生俱来的天分,也不是一天成就的。

1. 课程视频更新后,学员需要观看课程视频并且在社区留言打卡; 

除此之外,有工作人员在处理“其他垃圾”的时候,被喷溅的化学品灼伤,留下印记。而化学品,本是属于“有害垃圾”的类别。

左边,是个识别工具,架在传送带上。所有经过的物体,都要被它犀利的眼神计算机视觉算法瞬间看清材质。

5. 课程结束后,优秀的学员可以获得社区提供的福利以及礼品;  

如果是一条拥挤的传送带,上面的垃圾眼花缭乱,人类也可以和机器人并肩战斗:充气机械臂柔软细腻,是为了人类的安全定制的。

By 知乎答主“糖葫芦喵喵”

第十二讲:基于模型的策略学习

4月19日无人机拍摄的北京世园会园区。新华社记者 侯东涛 摄

是“带雨方知国色寒”的牡丹?

2019年中国北京世界园艺博览会

你在一片花海中醒来……

2013年,来自芬兰的ZenRobotics,孕育了世界上第一台垃圾分拣机器人,叫ZRR。

它主要负责二次分拣,比如从已经筛过一次的“塑料瓶”当中,把乱入的塑料袋、易拉罐扔出去。

“单单是欧盟,每年就会产生9亿吨建筑垃圾。把体积换算成汽车,可以绕地球45圈。”

是“一片青天白鹭前”的桃花?

雷锋网雷锋网(公众号:雷锋网)雷锋网

与工程师的身材对比一下,就知道它有多大:

第九讲:高级策略梯度

正从这里伴着春天的脚步走来

进入2019 UC 伯克利 CS285 深度强化学习小组即可视为成功报名!

来到2019年,它的后辈依然火眼金睛,依然拥有轻快的操作;但已经不那么咄咄逼人,变得娇小又柔软。堪称人类的好朋友。

thaireader.com

E-mail : mail@thaireader.com