Đội ngũ Uptempo Data vận hành và xây dựng dữ liệu văn bản của hơn 10 triệu câu mỗi năm một cách có hệ thống. Với đội ngũ biên dịch viên chuyên nghiệp từ hơn 50 quốc gia, hơn 30 cặp ngôn ngữ trên toàn thế giới và “hoạt động cộng đồng”, chúng tôi có thể giải quyết thỏa đáng các dự án dữ liệu ngữ liệu ngôn ngữ lớn và đặc biệt mà các công ty khác khó thực hiện.
Quá trình của chúng tôi:
- Thiết kế tệp:
Chúng tôi phát hiện các câu sai và các câu không hiệu quả bằng cách xem xét toàn bộ tệp công việc.
- Phân công tệp:
Độ khó và lĩnh vực được chia nhỏ, và các chuyên gia thích hợp được xem xét và chỉ định.
- Giám sát trực tiếp:
Bằng cách làm việc trên Cloud, mọi nhân viên có thể xem trạng thái công việc trong thời gian thực.
- Đối chiếu bản dịch AI:
Nếu tỷ lệ trùng khớp với các trình dịch máy khác cao, chúng tôi sẽ rà soát loại sản phẩm từ đầu một lần nữa.
- Đánh giá chất lượng:
Chúng tôi thực hiện đánh giá chất lượng khách quan và các hồ sơ có điểm thấp sẽ trải qua việc rà soát lần hai.
- Thu nhận/phân phối tệp:
Khi các tệp cuối cùng được tập hợp, việc xem xét lần cuối được thực hiện và các tệp hoàn thiện tối ưu sẽ được giao cho khách hàng.
Kiểm soát chất lượng để xây dựng kho dữ liệu:
Từ việc chuẩn bị dữ liệu văn bản đến xây dựng và sử dụng dữ liệu cuối cùng, nhóm Uptempo Data đảm bảo chất lượng cao cho lượng lớn dữ liệu.
- Kiểm tra miền
Kiểm tra xem các miền chẳng hạn như pháp lý / y tế / trò chơi / CNTT có khớp hay không
- Kiểm tra độ dài câu
Phân tích độ dài câu giữa ngôn ngữ nguồn và ngôn ngữ đích, dịch lại nếu độ dài câu giữa hai ngôn ngữ này khác nhau cao
- Sao chép
Loại bỏ các câu khớp hoàn toàn
- Phân tích sự giống nhau ở bản dịch máy
Phân tích sự tương đương của bản dịch máy bằng cách sử dụng chỉnh sửa Distance (dịch lại cho các chuỗi có độ tương đồng cao)
- Xác minh sự phù hợp về ngữ nghĩa
Đánh giá chất lượng sự phù hợp về ngữ nghĩa thông qua chuyên gia của bên thứ ba
- Xác thực mô hình AI
Xác thực dữ liệu bằng cách sử dụng những giải pháp AI
- Phân phối
Phân phối ở dạng tệp do khách hàng yêu cầu, chẳng hạn như CSV, JSON, v.v.
