展示HN:我抓取了30亿条Goodreads书评来训练一个更好的推荐模型。
Show HN: I scraped 3B Goodreads reviews to train a better recommendation model

原始链接: https://book.sv

输入你读过的书,我们的模型会为你推荐接下来要读的书。 搜索结果和生成的推荐仅包括达到流行度阈值的书籍。 较不流行的书籍可以在本网站的其他地方使用。 为了获得最佳效果,请提供 3 本或更多书籍。

一位开发者推出了“book.sv”网站,该网站提供书籍推荐,其动力来自一个在**30亿条Goodreads书评**上训练的模型。该网站包含两个工具:推荐引擎(输入书籍,获取建议)和“用户交集”功能(查找阅读过相同书籍的Goodreads用户——提供退出选项)。 早期用户报告说,即使输入有限,推荐通常也不错,而且网站速度令人印象深刻。反馈集中在改进发现功能,使其不局限于推荐已读书籍,优化用户界面(在添加书籍后移除建议书籍),以及降低搜索的严格性。 开发者使用50-100个数据中心代理抓取了Goodreads数据,并指出住宅代理现在价格实惠。他们正在考虑根据需求开发API,并承认该模型可以在CPU上高效运行。讨论还涉及了Goodreads的替代方案以及细致推荐的挑战(例如,找到*类似*特定标题的书籍,而不仅仅是该系列中的任何书籍)。
相关文章

原文
Input books you've read and receive recommendations on what to read next from our model. Only books that meet a popularity threshold are included in the search results and generated recommendations. Less popular books can be used elsewhere on this site. Provide 3+ books for best results.
联系我们 contact @ memedata.com