最近DeepSeek 十分流行,不單帶動科技股上升,也帶來一股AI(人工智能)熱。筆者當然有試用DeepSeek、Poe、豆包、Kimi、Cursor AI、訊飛星火、文心一言、日日新、Microsoft Copilot、Gemini等AI 工具,也會應用於日常工作之中,例如寫稿、做圖等等。也會在自己大學的功課不懂做時會問AI師兄,自己研判AI 師兄的合理性而作出適當的修訂及修改,甚至我教孩子應用AI來作功課「急救」。
比較5個AI工具答案
在早前的期終試,我已試用AI 來出卷給孩子溫習,也會用AI 出卷給我自己溫習,鞏固概念。對我來說,AI 出卷有助自己可溫習得更仔細,留意到平時容易忽略的盲點,結果考試3科也考了A ,這證明對我來說是一個有效的溫習方法。我的心得是,遇上計算的題目,同一時間開5個AI 應用來測試,若然有2個或以上的答案是一樣,再加上自己的「人工智能」邏輯地去判斷,就當它是答案去交功課,大約80%機會答案正確。

加上額外指令 生成獨到試卷
筆者會把孩子或自己的測驗範圍內多份筆記上載去AI AGENT,並寫出指令叫他們協助做卷或出測驗題目,我也會加上一些額外指令,例如題目或答案需要是隨機順序 (random order),因為若不寫出是隨機答案,就很可能會出現第一題答案是A,第二題答案是B,第三題答案是C,如此類推。
此外,筆者也會寫明叫AI 出些什麼類型的題目、需要出多少條題目,建議用家切忌太進取,一次過出太多種不同類型的題目。我建議可以就以下題型,叫AI 撰寫出一個100總分組合,例如「10條選擇題」、「15條供詞填充題」、「7條短問答」、「5條長題目」、「5條配對題」,「8條是非題」等等,然後再叫AI 列出答案及加以解釋(answer key) ,這份獨一無二的溫習試卷就能生成來。
中史中文答覆竟強差人意?

我暫時經驗是DeepSeek及豆包出的試卷是比較「靠譜」,80-90% 內容是可用的。筆者喜歡用內地的AI 工具,因為一來有內地電話就可以登記免費使用,二來,計算上結果上會較精準、答對率比外交部牌子高。如果沒有內地電話號碼,一咭兩號也只是加港幣$18一個月,肯定比外國產品月費便宜。
如果是較簡單的功課,例如一頁紙的填充題,如家長有Microsoft Copilot 戶口的話,可以拍照在WhatsApp 取得簡單答案及解釋,按微軟官方說法是這個AI 只有小六程度,筆者暫時試過中一英文類科目,包括數學、綜合科學、歷史、英文都能出到較合理的答案,但是在中國歷史或中文工作紙的答案就有點強差人意。筆者有讓孩子在忘記帶書本回家情況下用AI 作為「急救」之用。
AI答案非完美 需人腦判斷
至於,是否擔心AI 會取代人類,我早前看了一段有關Manus 的視頻,作者以Manus 比喻為全自動洗衣機,如果人類沒有把衣服及清潔劑放進洗衣機內、沒有按制,洗衣機是不能自動清洗衣物的、也不會把自己放到晾衫架晾乾,所謂的「全自動」是有條件下的全自動,仍然需要人類的人手操作。所以我的看法是既然AI 是不能逆轉的趨勢,不如好好擁抱AI 去為自己工作,畢竟AI 的答案並非完美,有些模糊邏輯還是需要人類用自己的知識及經驗去判斷。
鳴謝 :黃麗芳博士 親子專欄作家
圖片:Freepik
編輯:周僖婷