1F噓LayerZ: 抱歉忍不住 05/26 02:57
2F噓WJAider: 反過來說,AI 這個也可以,AI 那個也可以的話人人都會講 05/26 03:00
3F→LayerZ: 不打算抨擊你,但是你想討論的不是平衡而是AI至上 05/26 03:02
4F→ddavid: 講半天還是沒看到數學模型或至少 cost 分析,我還是等有 05/26 12:39
5F→ddavid: 至少 toy project 成果再討論比較實際 05/26 12:39
6F推ddavid: 講 AI 至上論我其實沒啥問題,問題大的地方在找解本來就 05/26 12:47
7F→ddavid: 也是 AI,有什麼理論基礎說找平衡 AI 表現就會比較優秀, 05/26 12:47
8F→ddavid: 也沒看到 05/26 12:47
9F→ddavid: 特別是還提出什麼找發散,這根本與現今所有主流 AI 概念 05/26 12:49
10F→ddavid: 都是相反的,不管找解找異質找多樣性,現今 AI 始終是用 05/26 12:49
11F→ddavid: 收斂方式,找發散的數學模型到底長怎樣我是真的願聞其詳 05/26 12:49
12F→ddavid: 而且講來講去居然丟一個 GA 出來,明明 GA 正是上一代 AI 05/26 12:52
13F→ddavid: 裡面找收斂解的經典之一(不是因為它同時找多組就叫做找 05/26 12:52
14F→ddavid: 發散了),到底怎麼冒出找發散概念的 05/26 12:52
演化式計算是在Crossover/Mutation與Selection兩大主要步驟做iteration
Selection力道越強 space會越收斂 所以經常用來找收斂
這不代表演化式計算只能找收斂
把evo step加強 削弱selection力道 就能拿到發散中的space
15F推ddavid: 要是提個 GAN 還比較有譜,雖然跟找發散還是八竿子打不在 05/26 12:54
16F→ddavid: 一起 05/26 12:54
GAN也可以啊 要怎麼define誰是G誰是D 我也是樂意討論
把G當作平衡數值產生器可以 我當初的問題是卡在D要怎麼去評價這個G?
因此我試圖用strategy space作為評價方式 當strategy space複雜度越高越好
相當於G對D打分越高 但這就脫離GAN本身的概念是對抗
另外還要找增加space複雜度的方法
17F推ddavid: 另外沒價值那段根本是你把話塞別人嘴裡,事實始終是做得 05/26 12:59
18F→ddavid: 不夠強就沒價值,強了當然有價值。那要強需要什麼,有理 05/26 12:59
19F→ddavid: 論基礎、有實作成果、有重現性。而不是隨便來個思考轉彎 05/26 12:59
20F→ddavid: 就叫做有價值,遊戲界最不缺的就是點子。 05/26 12:59
要是沒做出實驗就沒價值 那現代科學早就停滯不前了
你去跟愛因斯坦說死前沒做出prototype所以相對論沒價值 弦論沒實驗沒價值
理論先行早就是常態 討論如何define 如何套用已經存在的技術
都討論完當然可以丟下去實驗 目前就還是在討論和設計階段
我的推導到也不是為了停在純理論 而是要找出一個可以落地的方式
誠如前面說的哪種AI我都可以 討論define出好的GAN我來訓練也很樂意
※ 編輯: PosetMage (220.146.150.15 日本), 05/28/2023 22:18:38
21F→wangm4a1: BZ例子重點不在平衡 而是被砍的玩家不高興 05/30 13:52
22F→wangm4a1: 發文造成玩家不滿 可以求助AI改善語氣 05/30 13:54
23F推ddavid: 我真的覺得你要好好重新思考一下你口中的找發散到底是什 05/31 19:09
24F→ddavid: 麼東西…… 05/31 19:09
25F→ddavid: GA 用於找收斂,不代表把參數反向操作就會「找發散」,說 05/31 19:17
26F→ddavid: 到頭來你所謂找發散到底數學模型是什麼東西?你讓結果發 05/31 19:17
27F→ddavid: 散那停止條件是什麼?你怎麼證明你所謂的發散結果比隨機 05/31 19:17
停止條件在講什麼東西 你好好重新思考一下為甚麼圍棋AI到現在ELO還是在上升中
28F→ddavid: 更發散或更平衡?要是連個 objective function 都寫不出 05/31 19:17
29F→ddavid: 來,那你已經是在開創非現行機器學習的新領域了,恭喜你 05/31 19:17
30F→ddavid: 成為先驅並期待你的實作與應用 05/31 19:17
31F→ddavid: 還拿愛因斯坦來比,理論物理學家雖然不一定做實驗證明, 05/31 19:21
32F→ddavid: 但是會提出嚴謹的理論模型,而且根據那個模型計算的結果 05/31 19:21
33F→ddavid: 還要能夠不違反過去所有的相關實驗結果好嗎? 05/31 19:21
34F噓WJAider: 有臉拿愛因斯坦跟自己抬槓比,相對論是論壇聊出來的? 05/31 20:33
35F→WJAider: 先理解論壇抬槓跟論文的差距再找比喻比較好 05/31 20:35
※ 編輯: PosetMage (118.86.155.227 日本), 06/01/2023 10:04:34
36F→ddavid: 無視停止條件,我很難相信你在做 AI 耶XD 06/02 19:11
37F推ddavid: 你可以回去複習一下你自己提的 GA 一樣需要 Stopping Con 06/02 19:22
38F→ddavid: ditions,不然它怎麼判斷演化足夠好可以給你結果了 06/02 19:22
39F→ddavid: 至於 AlphaGo 為什麼還有機會持續訓練提升實力,原因也很 06/02 19:32
40F→ddavid: 簡單,你可以先猜看看。 06/02 19:32
41F→ddavid: 但即便是這樣,AlphaGo 還是要收斂出 李世石版、Master 06/02 19:32
42F→ddavid: 版以及 AlphaZero 這些特定版本。理由也很淺顯易懂XD 06/02 19:32