使用 transformers 库

openclaw 中文openclaw 2026-04-09 1

OpenClaw 是一个开源的文本分类和实体识别工具，以下是获取 OpenClaw 资源包的相关信息：

使用 transformers 库-第1张图片-OpenClaw下载中文-AI中文智能体

🔧 核心资源获取

官方仓库

GitHub: https://github.com/CLUEbenchmark/OpenCLaw
包含完整的源代码、文档和基础模型

预训练模型

OpenClaw 提供了多种预训练模型：

中文模型：

openclaw-bert-base-chinese - 基础中文BERT
openclaw-bert-wwm-ext - 全词掩码中文BERT
openclaw-roberta-base - RoBERTa中文模型

下载方式：

model = AutoModel.from_pretrained("CLUE/OpenCLaw-bert-base-chinese")

数据集

OpenClaw 支持多个公开数据集：

文本分类：

THUCNews（中文新闻分类）
ChnSentiCorp（情感分析）
TNEWS（今日头条新闻分类）

实体识别：

MSRA-NER
People's Daily NER
CLUENER

📦 安装与使用

安装步骤：

# 1. 克隆仓库
git clone https://github.com/CLUEbenchmark/OpenCLaw.git
cd OpenCLaw
# 2. 安装依赖
pip install -r requirements.txt
# 3. 安装 OpenClaw
pip install -e .

快速使用示例：

from openclaw import Classifier
# 初始化分类器
classifier = Classifier(model_name="bert-base-chinese")
# 训练
classifier.train(train_data, labels)
# 预测
predictions = classifier.predict(test_data)

📁 项目结构

OpenClaw/
├── configs/          # 配置文件
├── data/            # 数据加载和处理
├── models/          # 模型实现
├── trainers/        # 训练器
├── utils/           # 工具函数
├── scripts/         # 运行脚本
└── tests/           # 测试代码

🚀 快速开始资源

预置脚本：

# 文本分类示例
python scripts/run_classification.py \
  --model_name bert-base-chinese \
  --dataset_name thucnews \
  --do_train
# 实体识别示例
python scripts/run_ner.py \
  --model_name bert-base-chinese \
  --dataset_name msra \
  --do_train