孙立京
卡塔狗中的权重如何理解?起什么作用?
华韬
权重就是对每个点的基础评分
郝天一|四段|RIF206
权重是神经网络参数
郝天一|四段|RIF206
一般是神经网络用来拟合非线性函数时候乘的系数
华韬
传统算法会算很多臭棋,权重过滤掉了很多臭棋,让搜索范围大大减少
郝天一|四段|RIF206
一般是一大堆矩阵的集合
郝天一|四段|RIF206
把权重的这些矩阵,和局面信息合起来,经过一系列复杂的运算
郝天一|四段|RIF206
可以对局面给出一个评分
郝天一|四段|RIF206
训练好的权重,可以隐含一系列复杂的逻辑
朱凯|二段
这些汉字我都认识,组合起来不知所云
华韬
郝博士说的比较专业
华韬
我说的就是翻译过来的
郝天一|四段|RIF206
华韬你说的那个根本不是权重,你说的是评分
华韬
权重就是计算评分的参数啊
郝天一|四段|RIF206
“计算评分的参数”和“评分”是两个不同的东西
华韬
我知道但是描述太专业一般人懂不了所以就牺牲一些严谨让更多人明白
郝天一|四段|RIF206
这就像有人问司机是什么,回答汽车一样,这不是严不严谨的问题,说的是两件事
华韬
一个意思,一般人不会关心司机怎么开车,有什么技术,只关心能开动汽车把我运送到目的地,这个问题没有对错,只是理解角度和出发点不一样而已,纯理论肯定你是严谨的
鄭睦融「RIF121
權重描述成評分確實有點怪異
孙立京
计算的胜率和权重顺序,哪个是我们通常理解的强弱顺序呢?
宣然
好喜歡這種專業知識普及
岑活愉
各项初始评分x权重=综合评分
陈沁巧
我觉得胜率有时候没啥用,毕竟人有时候算不到唯一
岑活愉
你这么说必胜谱有时候也没啥用,
毕竟也不是人人都看
陈沁巧:我觉得胜率有时候没啥用,毕竟人有时候算不到唯一
陈沁巧
低胜率的话
陈沁巧
岑活愉必胜有点参考意义。比如知道结论,即使不看,也会大胆的做棋,大胆的牵制
岑活愉
胜率不也是同样的意义吗
岑活愉
一个20,一个80,你选哪个?
郝天一|四段|RIF206
计算的那个胜率,是多次搜索的平均值,相当于你深入长考之后的结果,初始评分相当于你根据棋感估计出来的结果
陈沁巧
下的时候哪晓得那个是几十?
陈沁巧
感觉每手都是100
岑活愉
那你说胜率是哪里看的?
陈沁巧
下完后,每个开局统计,打点统计,每个点统计
鄭睦融|RIF121
有個細節我一直不太清楚勝率是由mct產生的還是一個被訓練過的權重根據輸入的局面輸出出來的數值
华韬
狗官方的描述是当前胜率等于下一个局面各个选点胜率的计算量的加权平均值
鄭睦融|RIF121
還是說權重會算出預期勝率分配計算量然後再由mct模擬出後續勝率?流程好模糊.
郝天一|四段|RIF206
是由mcts多次模拟后,所得到的一个平均值,计算平均值用的每一个值,都是用权重计算出的一个胜率
孙立京
以这个局面为例,正常理解最强的点是蓝17,但计算值是16、J6更高。这个局面数值还算接近,那么如果差距较大,是该信计算的胜率还是右上角标呢?
孙立京
郝天一|四段|RIF206
孙励精信胜率
陈沁巧
这个不是选3么?
华韬
信胜率但是还要看计算量
华韬
计算量约大,可信度越高
孙立京
当然是要在足够的计算量支撑下了。
孙立京
按狗的说明,那个胜率7.5是“胜局+和局/2”
郝天一|四段|RIF206
那个初始排序的可信度不高(不过估计也有段位水平)
华韬
狗的说明是,胜率=走完这是之后,(1-下一个局面各点胜率的加权平均)
华韬
狗的说明是,胜率=走完这步之后,(1-下一个局面各点胜率的加权平均)
华韬
从单步理解来说是这样的
华韬
比如当前局面某个点是必胜,但是下一步对方有很多强防,那就很有可能需要花很长时间才能把胜率算到很高的值
华韬
也可能永远算不出来,因为有些点初始权重评分点太低,就被忽略掉了,这个也俗称狗坑
华韬
甚至会出现颠倒黑白的情况
孙立京
作者说了,大约计算到30M可以滤掉绝大部分狗坑。
华韬
但是一个局面能算到30M的点并不多,最后都是只算排名靠前的点了
华韬
之后每个局面少算一个点,汇总到当前局面坑就多了
郝天一|四段|RIF206
只是绝大部分而已,该有狗坑还是会有的色很多坑是不能靠堆计算量来解决的
郝天一|四段|RIF206
感觉狗的那种机制,不适合暴力算杀
郝天一|四段|RIF206
甚至可以这么说吧
郝天一|四段|RIF206
现有的成熟软件里,就没有适合暴力算杀的
华韬
狗的作用是最大程度提高棋力,付出的代价就是牺牲出小概率犯错的情况
陶涛
我来解释:五子棋绝对避免坑是不可能的,绝对避免坑需要无穷大的计算力,没有任何软件计算力是无穷大的
华韬
这个小概率<5%
郝天一|四段|RIF206
甚至胚胎和rapfi那种算杀,也只是将就能看而已
郝天一|四段|RIF206
根本没法算法优化到极致,还差得很远
陶涛
你所追求的不能是无穷大,而是相对较大,就要划定一个大致容错标准,用概率来衡量
郝天一|四段|RIF206
5%的犯错率还是比较大的e这意味着每20手棋就要走错一手
郝天一|四段|RIF206
或者说,每盘棋基本就会至少犯错一次
华韬
每盘棋出现的概率<5%
华韬
下100盘会犯5次错
郝天一】四段|RIF206
我觉得这也得看对手是谁,不能简单用一个概率表示的
郝天一|四段|RIF206
对不同的对手,这个出错率肯定不一样
华韬
这个错给人用的话也抓不住
郝天一|四段|RIF206
假设以后有一个比狗强很多的软件
郝天一|四段|RIF206
说不定它犯错率会达到95%也说不定
华韬
这只是个感官上的估值不是准确的
华韬
对只是以人类水平为基础的感官上的估值
郝天一|四段|RIF206
我感觉是否犯错,其实也没法准确判定
华韬
如果按棋神的标准,那还真是90%
郝天一|四段|RIF206
有时候它可能只是走得不是那么强,但你又不好说它错
郝天一|四段|RIF206
甚至它走得是不是最优解,你也不清楚
鄭睦融|RIF121
用犯錯來描述狗有點本末倒置我們追求的棋力不就是希望已盡可能少的算力得到盡可能強勢的路線嗎?不想犯錯那就窮舉完事
华韬
没有完美的东西,一个方面太强了,一定会有对应的弱点
华韬
狗和狗坑就是对照
郝天一|四段|RIF206
问题是,很多时候,穷举这种事儿,在有生之年是做不到的
郝天一|四段|RIF206
想研究一个棋,我们需要的不是无限的时间,只要足够充分的时间就可以了
鄭睦融|RIF121
就算做到了人們也不滿意我們會開始限制狗的計算量或是加大棋盤
岑活偷
量子计算机请求出战
康弘哲
Afternoon
华韬
就像派的值一样,在生活上一般人用到小数点后几位就足够了,再往后就是纯数学问题了
吴晓宁
别这么说专业好吗?
华韬
如果有人说派就等于3.1416,也不能说他错了
吴世力
3.1415926
朱叶|纪律委员|2级
华韬
3.1415926
吴世力
好像也没错
孙立京
三点一四一五九二六五三五八九七九三
吴晓宁
没有比狗更强的软件前。狗就是上帝
吴世力
记得真多!
转载请注明出处。