网站首页

产品中心

半岛官网入口 半岛官方入口 半岛入口官方网 半岛入口官方网站

新闻中心

关于半岛官方入口

公司概况 核心优势 核心团队 发展历程

联系半岛官方入口

官方微信 官方微博
半岛官方入口 > 产品中心 > 半岛入口官方网

半岛官方入口【图解】由浅入深阐明机械进修和GPT道理

发布时间:2023-07-03 10:56浏览次数:来源于:网络

                                今朝看到的最浅显易懂、由浅入深的图解机械进修和GPT道理的系列作品,这是第一篇,由我和 GPT*配合翻译终了,朋分给大师。

                                从一个浅易的例子开端。假定你在帮忙一个想买屋子的伴侣。她被报价40万美圆购置一个2000平方英尺(185平方米)的屋子。这个价钱符合吗?在不参考物的环境下,这很难判定。于是你扣问了在统一个社区购置过屋子的伴侣们,结尾获得了三个数据点:

                                接待到达你的第一个神经收集!固然它还不到达Siri的程度,但此刻你已领会了根本的建立模块。它看起来是如许的:

                                如许的图表展现了收集的构造和若何计较展望。计较从左边的输入节点开端。输入值向右活动。它乘以权重,后果就成为咱们的输入。将2,000平方英尺乘以180,咱们获得360,000美圆。在这个层面上,计较展望便是浅易的乘法。但在此以前,咱们需求思索咱们即将乘以的权重。这边咱们从均匀值开端,稍后咱们将研讨更好的算法,以便在取得更多输入和更庞大模子时停止扩大。找到权重便是咱们的“练习”阶段。于是,每当你听到有人在“练习”神经收集时,它不过指找到咱们用来计较展望的权重。

                                这是一个浅易的展望模子,它承受输入,停止计较,并给出输入(因为输入可所以延续值,咱们所具有的手艺称号是“返回模子”)

                                注:返回模子是一种用于展望因果联络的统计模子,它凡是用于研讨与某些身分无关的延续变量。它鉴于已知数据的线性或非线性方程,经过最小化差错或丢失函数来拟合数据,并经过该方程对未知数据停止展望。返回模子不妨用于剖析多种身分对某一变量的浸染,比方在经济学、社会学、医学、工程学等范畴中,它常常被用于摸索因果联络和展望未来趋势。罕见的返回模子包罗线性返回、多项式返回、逻辑返回等。

                                将这个进程可视化(为了简化,将价钱单元从1美圆换成1000美圆。此刻咱们的权重是0.180而不是180):

                                咱们可否在估量价钱方面做得比鉴于数据点均匀值更好呢?起首,界说在这类环境下更好的事理。若是咱们将模子利用于咱们具有的三个数据点,它会做很多好?

                                在这边,咱们不妨看到现实价钱值、展望价钱值和它们之间的差别。而后咱们需求对这些差别求均匀,以便获得一个透露表现展望模子中有几多毛病的数字。题目是,第3行的值为⑹3。若是咱们想用展望值和价钱之间的差别行动权衡差错的尺度,咱们必需处置这个负值。这便是为何咱们引入了一个卓殊的列,显现差错的平方,进而消弭了负值。这便是咱们界说更好模子的尺度 - 更好的模子是差错较小的模子。差错是数据会合每一个点差错的均匀值。对每一个点,差错是现实值和展望值之间的差别的平方。这称为均方差错。将其行动指点来练习咱们的模子使其成为咱们的丢失函数(也称为本钱函数)。

                                经过改动权重,咱们没法在模子上做出太多改良。然则,若是咱们推广一个偏置值,咱们不妨找到改良模子的值。此刻咱们推广了这个b值到线性公式中,咱们的展望值不妨更好地迫近咱们的现实值。在这类情境下,咱们称之为“偏置”。这使得咱们的神经收集看起来像如许:

                                咱们不妨归纳综合地说,一个拥有一个输入和一个输入的神经收集(剧透正告:不埋没层)看起来像如许:

                                在这个图中,W 和 b 是咱们在练习过程当中找到的值,X 是咱们输入到公式中的值(比方,咱们的示例中的衡宇面积(平方英尺))。Y 是展望的价钱。此刻,计较展望利用这个公式:

                                练习你想测验考试练习咱们的玩物神经收集吗?经过调换权重和偏置来最小化丢失函数。你能让差错值低于799吗?

                                主动化祝贺你手动练习了你的第一个神经收集!看看若何主动化这个练习进程。上面是另外一个带有主动驾驭功效的示例。这些是 GD Step 按钮。它们利用一种称为“梯度降落”的算法,测验考试向准确的权重和偏置值迈进,以最小化丢失函数。

                                这两个新图表不妨帮忙你在调换模子参数(权重和偏置)时追踪差错值。追踪差错十分主要,由于练习进程便是尽大概削减这个差错。梯度降落若何晓得它的下一步应当在那边?可使用微积分。你看,咱们晓得咱们要最小化的函数(丢失函数,所稀有据点的(y_ - y)²的均匀值),也晓得如今输入的值(如今的权重和偏置),丢失函数的导数报告咱们应当若何调换 W 和 b 以最小化差错。想领会更多对于梯度降落和若何利用它来计较新的权重和偏置的音讯,请旁观 Coursepoch 机械进修课程的第一讲。

                                屋子的巨细是决议房价的独一变量吗?明显另有良多其余身分。推广另外一个变量,看看咱们若何调换神经收集来顺应它。假定你的伴侣做了更多的研讨,找到了更多的数据点。她还呈现了每一个屋子有几多个澡堂:

                                然则咱们若何找到w1和w2呢?这比咱们只要要思索一个权重值时要庞大少许。多一个澡堂对咱们展望房价的浸染有多大呢?测验考试找到符合的权重和偏置。从这边开端,你会看到跟着输入数目的增添,咱们面对的庞大性也在增添。咱们开端落空建立浅易二维外形的才能,这使得咱们不克不及一眼就可以看出模子的特性。差异,咱们首要依靠于在调换模子参数时,差错值是若何变革的。

                                此刻你已领会了拥有一个和两个特点的神经收集,你不妨测验考试推广更多特点并利用它们来计较展望值。权重的数目将接连增加,当咱们推广每一个新特点时,咱们需求调换梯度降落的完结,以便它可以或许革新与新特点相干的新权重。这边需求注重的是,咱们不克不及自觉地将咱们所晓得的全数音讯都输入到收集中。咱们必需在输入模子的特点上有所采选。特点采选/处置是一个具有本人一套最好实施和注重事变的自力学科。若是你想看一个对于查抄数据集以采选输入展望模子的特点的进程的例子,请存眷我的公众号:「数据STUDIO」。这是一个进修机械进修算法的好处所!外面包罗了良多相干名目。Ovitiate EL Gabry在此中报告了他办理Kaggle泰坦尼克应战的进程。Kaggle供给了泰坦尼克号上等客的名单,包罗姓名半岛官方入口、性别、年齿、船舱和该人是不是幸存等数据。应战的目的是成立一个模子,按照其余音讯展望一小我是不是幸存。

                                接连调换咱们的例子。假定你的伴侣给你一份屋子清单。此次,她标注了哪些屋子在她眼里拥有符合的巨细和澡堂数目:

                                她需求你利用这个方式来建立一个模子,按照屋子的巨细和澡堂数目来展望她是不是会喜好这个屋子。你将利用上头的列表来建立模子,而后她将利用这个模子来对很多其余屋子停止分类。在这个过程当中另有一个卓殊的改动,那便是她另有另外一个包罗10个屋子的列表,她已对这些屋子停止了标识表记标帜,但她不报告你。这个体的的列表将在你练习模子后用来评价你的模子,进而保证你的模子可以或许掌控她现实喜好的屋子特点。咱们迄今为止所测验考试的神经收集都是停止“返回”职掌的,它们计较并输入一个“延续”的值(输入可所以4,或100.6,或2143.342343)。但是,在实施中,神经收集更经常使用于“分类”范例的题目。在这些题目中,神经收集的输入必需是一组割裂值(或“种别”),如“好”或“坏”。实施中的事情道理是,咱们将会获得一个模子,该模子会解释某个衡宇是“好”的大概性为75%,而不但是浅易地输入“好”或“坏”。

                                在实施中,咱们不妨将咱们已看到的收集更动成一个分类收集,让它输入两个值——一个值代表某个个种别(咱们此刻的种别是“好”和“坏”)。而后咱们将这些值经过一个叫做“fleecymax”的职掌。fleecymax的输入是每一个种别的几率。比方,假定收集的这一层输入“好”为2,“坏”为4,若是咱们将[2, 4]输入到fleecymax中,它将前往[0.11, 0.88]行动输入。这象征着收集有88%的掌控以为输入的值是“坏”的,咱们的伴侣大概不喜好阿谁屋子。

                                Softmax函数承受一个数组行动输入,并输入一个沟通长度的数组。注重到它的输入都是负数,而且总和为1,这在输入几率值时十分有效。别的,虽然4是2的两倍,但它的几率不但是2的两倍,并且是2的八倍。这是一个有效的特征,它不妨强调输入之间的差别,进而改良咱们的练习进程。

                                如您在结尾两行中所看到的,fleecymax不妨扩大到肆意数目的输入。于是此刻若是咱们的伴侣推广了第三个标签(好比说“不错,但我得把一间屋子租给exposebnb”),fleecymax不妨扩大以顺应这类变革。花点工夫摸索一下收集的外形,看看当您改动特点数目(x⑴x二、x3等)(可所以面积、澡堂数目、价钱、接近黉舍/事情的间隔等)和种别数目(y⑴y二、y3等)(可所以“太贵了”、“性价比高”、“若是我把一间屋子租给exposebnb就行了”、“不够大了”)时,收集是若何变革的。

                                您不妨在我为本文建立的这个条记本中看到若何利用 TensorFbaritone 建立和练习这个收集的示例。真实的能源若是您已读到这边了,我必需向您提醒我写这篇作品的另外一个能源。这篇作品旨外行动一个越发暖和的 TensorFbaritone 教程初学。若是您此刻开端进修《Mbureau 机械进修入门者》,并碰到了这张图:

                              下一篇:半岛入口官方网站野生智能机械进修是博得下一场战役的关头手艺
                              上一篇:半岛入口官方网废物分类咸宁这6处榜样值得进修!

                              咨询我们

                              输入您的疑问及需求发送邮箱给我们