评估和基准测试 LLM 性能
npx skills add wshobson/agents@llm-evaluation -g -y
在终端运行即可安装。支持 Claude Code、Cursor、Windsurf 等 42 个 AI 平台。
Evaluating and benchmarking LLM performance
PostgreSQL 高级特性,包含 CTE、窗口函数、JSONB 和全文搜索
混合搜索数据管理,支持向量索引、全文索引和查询优化
Apache Airflow DAG 编排,支持算子、传感器和任务依赖
MongoDB 聚合管道,支持 $lookup、$group、$bucket 和 $graphLookup 阶段