AI News Collector
自动采集AI相关新闻和趋势的工具。
功能
- 📡 多源采集:arXiv、HuggingFace Papers、GitHub Trending
- 🔄 智能去重:避免重复内容
- 📊 权重排序:根据来源和关键词匹配度排序
- 📝 简报生成:自动生成Markdown格式简报
配置
代理设置
工具支持HTTP/HTTPS代理,用于访问国外数据源。
方式1:环境变量
export HTTP_PROXY=http://127.0.0.1:7890
export HTTPS_PROXY=http://127.0.0.1:7890
方式2:修改代码
在 skill/ai-news-collector/collect.js 中修改 PROXY_HOST 常量:
const PROXY_HOST = 'http://127.0.0.1:7890';
数据源配置
编辑 config.json 文件:
{
"topics": [...], // 主题关键词
"sources": {
"arxiv": { "enabled": true, ... },
"huggingface": { "enabled": true, ... },
"github": { "enabled": true, ... }
}
}
使用
手动采集
cd /Users/chenbj/home/workspace/OpenclawSpace/AINewsCollector
node skill/ai-news-collector/collect.js
定时采集
已配置cron job,每天自动采集两次:
- 09:00 - 每日推送
- 23:00 - 每日采集
输出
生成的简报保存在 daily/ 目录:
- 文件名格式:
YYYY-MM-DD.md - 内容包括:Top 10重要消息、分类汇总
故障排查
采集为0条
- 检查网络连接
- 确认代理配置正确
- 查看错误日志输出
代理配置
如果访问HuggingFace或GitHub超时,需要配置代理:
- 代理地址:
http://127.0.0.1:7890 - 支持HTTP和HTTPS协议
更新时间: 2026-02-24
Description
Languages
JavaScript
100%