"The power of Serverless for front-end developers" # # 整理了前端工程師可以用到的 serverless 線上服務,不只提供靜態檔案,連表單、金流、影音串流、E-mail、SMS、CMS 管理、全文搜尋、即時通訊、權限認證都有,後端工程師要失業了嗎? XD
看了 Linkedin 團隊寫的關於打造 RAG 產品的實戰心得: Musings on building a Generative AI product
* 使用小模型用於將用戶問題進行路由,決定查詢是否在範圍內,然後轉發給不同 AI agent 來回答。使用大模型用在最後生成回答
* 有負責整體體驗、評估、基礎設施、UI
有些 LLM 的 Benchmark 表現好,是因為先看了題目把答案背起來了,而不是腦子好。
這個月 Scale AI 的一篇論文 Careful Examination of Large Language Model Performance on Grade School Arithmetic 實驗表明了資料集污染卻有其事。
最大苦主是 Mixtral 8x22B 和 Phi-3,準確率的真實表現比
在 LLama2-70b 模型中,針對數學推理問題的最佳提示詞是 Star Trek 星際爭霸戰啊 🤣
system promot:「指揮官,我們需要你規劃一條路徑穿越這場亂流,並找出異常的源頭。使用所有可用的資料和你的專業知識,引導我們度過這個充滿挑戰的情況。」
user prompt 開頭:「船長日誌,星曆 [此處插入日期] :
發了 愛好 AI Engineer 電子報 🚀 第 16 期,這期分享的內容有:
- What We’ve Learned From A Year of Building with LLMs
- How to think about AI application development
- 用繁體中文評測 RAG 的 Chunking 切塊策略
- Vision Agent
- AI Agents That Matter
- 家常軟體和草根開發者
-
嚴格的輸出格式限制,恐讓模型的推理變笨! 🤯
呼應 OpenAI 剛剛推出的 Structured Outputs 可以 100% 嚴格輸出 JSON,這麼巧就看到前幾天 8/5 剛出的這篇 Appier AI Research 和台灣大學合作的論文: Let Me Speak Freely? A Study on the Impact of Format Restrictions on Performance of Large
讀 "Waterfall" doesn't mean what you think it means"
1. 其實提到 waterfall 軟體開發的原始三篇論文,是主張 iterative 迭代開發的
2. 文檔是成功軟體專案的關鍵。特別是開源專案,花時間做好文檔,比去提升功能或code的品質更容易成功