跨越45万条公益项目的“深渊”:一个前一线公益人,如何靠AI帮行业“修路”?

1月15日 195 1

1. 从一线“泥泞”到行业“修路”


朱清林在光爱学校接待志愿者探访.png

之前在光爱学校工作的那五年,我一直处于公益的一线。那时我最直观的感受是,技术应用和数字化对于很多基层公益机构来说,似乎是一件“远水救不了近火”的事。大家每天忙于具体的救助、筹款和繁杂的事务,根本没有人手和精力去搞数字化。

这种技术的“滞后”,不仅让一线工作显得原始而冗余,更让很多真实的辛劳和善意,因为缺乏记录和整理,最终消失在了公众的视野里。

2024年,我来到基金会中心网(CFC)工作,身份从一线的实践者变成了行业的数据服务者。虽然我们直接面对的是基金会,但我常在想:理顺这些公益行业的数据,对那些在泥泞里奔波的一线同仁,究竟有什么意义?

慢慢地我发现,平台数字化的本质,其实是在做“修路”的工作。只有把全行业散乱的数据分好类、理清楚,让每一个具体的公益项目都能通过标签被精准检索到,一线机构才有可能通过数据被外界看见。当“资助方”和“执行方”之间实现了高效匹配,行业的资源才会真正流向最需要的地方。

2. 45万个项目背后的“深渊”

目前基金会中心网采集的存量项目约有45万个。如果你翻看过各个基金会的年报就会发现,填报的质量极其参差不齐。

有的项目介绍长达几千字,恨不得把所有故事讲完,却抓不住重点;有的短到只有几个字,让人如坠云雾。这种海量且非标准的原始数据,靠人工分类几乎是不可能完成的任务。这种“随性”的背后,其实是公益行业长期缺乏结构化表达工具的无奈,也是评价标准难以统一的缩影。

正因如此,行业内一直缺乏一个精准的项目议题检索功能。为了改变现状,基金会中心网整理了行业标准,设定了19个一级分类标签和115个二级分类标签

这19个领域,构建了我们理解公益的坐标系:

教育发展、医疗健康、生态环境、文化艺术、体育、助弱济困、社会优抚、乡村振兴、社区治理、应急管理、法律支持、科学技术、国际合作与发展、公益行业支持、青少年服务、女性发展、残障、养老支持与服务、以及“其他”。

3. 从“人工智能”到“自动驾驶”:三次技术突围

在实际的业务场景中,要让AI乖乖听话且高效工作,需要经历不断的“调教”。以下是我在开发过程中尝试过的三种路径,希望能给同样在探索“技术向善”的朋友一点参考。

方案一:初级智能体(Coze方案)——“心太野”

扣子打标签.png

我最先尝试了目前很火的智能体工具。通过RAG(检索增强生成)能力,指望它对照知识库直接打标。

遇到的坑:准确率很不理想。AI经常出现“幻觉”,它会觉得自己比规则更聪明,跳出知识库定义的标签去自创标签。在处理海量数据时,这种哪怕10%的偏差都是灾难性的。

方案二:本地知识库(CherryStudio方案)——“效率瓶颈”

CherryStudio.png

我换了思路,通过向量模型将标签定义转为本地知识库索引,再调用大模型进行匹配。

遇到的坑:准确率提高了,但效率太低。这依然是一种“对话式”思维,如果靠人工复制粘贴项目内容并等待结果,处理完45万次,可能需要好几年。

方案三:API+多线程自动化(Python方案)——真正的生产力

基金会项目AI智能打标签系统.png

最后,我回归到了程序员的终极武器:代码自动化。利用AI辅助生成的Python脚本,我调用了API接口,搭建了一套自动打标系统。这个方案的打标签结果,即准确又高效。

实现逻辑:它像一个勤恳的流水线工人,我开启了10个线程并行工作。它会自动读取项目名称、描述、基金会信息,调用火山方舟知识库检索,返回打标签结果,实时记录日志并重试失败项。

效果:仅仅用了一天时间,就把我们一整年采集的基金会项目全部分类打标完成。

4. 让每一份善意拥有自己的“坐标”

在公益行业,“看不见”往往是误解的开始。有了这些分类,这套系统就不再只是代码,而是一个服务于大家的工具:

  • 对于捐赠者:你不再需要从茫茫大海里找项目。如果你关注“残障”或“女性发展”,只需一键筛选,就能看到全国有哪些基金会在深耕这个领域,他们的项目做得怎么样。
  • 对于求职者:如果你是一个热衷于“生态环境”的年轻人,通过这些标签,你可以迅速锁定这个赛道里所有的基金会,看清他们的项目分布和关联,找到真正志同道合的机构。
  • 对于行业研究者:你可以一眼看出哪些领域是“热点”,哪些领域如“法律支持”或“公益行业支持”还需要更多的资源倾斜。

让每一份善意都能被精准检索,让每一个理想都能找到对应的坐标,这就是这套系统的价值所在。

5. 写在最后的话

排骨计划.png

现在,如果你打开基金会中心网的官网,已经可以按议题领域去查询项目了。那些曾经沉睡在年报里的文字,终于变成了可以被看见、被分析的活数据。

记录这个过程,不仅是想分享技术思路,更是想传递一份信心:在AI时代,我们这些公益从业者,不必被技术的高墙挡住。

我开发的这套系统,大部分代码其实也是在AI的辅助下完成的。技术并不冷冰冰,关键在于你用它去温暖哪一个角落。

所谓“技术向善”,大概就是:当面对45万份繁杂的数据时,我们能通过不断的探索,让公益的价值变得更清晰、更透明、更可触达一点。

朱清林公众号
技术向善基金会项目智能打标签基金会中心网AI打标签

评论(1)

发布评论