Mọi người ở mọi dân tộc, chủng tộc trên khắp thế giới, không phân biệt tuổi tác hay giới tính, đều thực hiện dán nhãn âm thanh. Nếu cần một bộ sưu tập tệp thoại mới, nó có thể được thực hiện tại Uptempo.
Chúng tôi thu thập từ giọng nói của trẻ nhỏ đến người trung niên, người già và thậm chí cả âm thanh động vật trong nhiều lĩnh vực khác nhau: đài phát thanh, lồng tiếng, tiếng động vật, chèn tiếng, video từ Youtube, âm thanh thiên nhiên và âm nhạc.
Kiểm soát chất lượng để xây dựng dữ liệu âm thanh
Nhóm Uptempo Data tuân thủ 5 nguyên tắc CẦN THIẾT chứa bí quyết riêng của chúng tôi. Và dựa trên cơ sở này, chúng tôi xây dựng dữ liệu hình ảnh đảm bảo chất lượng tối ưu.
- Thu thập dữ liệu thô
- Thu thập dữ liệu âm thanh ở định dạng tệp như MP4 (bao gồm dữ liệu văn bản SMI)
- Lọc và loại bỏ các phần im lặng và dữ liệu không cần thiết không phù hợp với mục đích xử lý và sử dụng
- Xây dựng dữ liệu nguồn
- Gắn nhãn dữ liệu như phân loại dữ liệu chi tiết và khử nhận dạng dữ liệu thô được thu thập
- Chuẩn hóa và thiết lập với dữ liệu nguồn ở dạng có thể được xử lý thông qua làm việc theo đám đông
- Xử lý dữ liệu nguồn
- Xử lý sơ cấp: Đánh dấu phần mục tiêu trong dữ liệu thoại công việc đích
- Xử lý thứ cấp: Bảo mật dữ liệu thoại trong khu vực được hiển thị và xây dựng văn bản (Nhãn)
- Xét duyệt dữ liệu đã xử lý
- Hoàn tất xét duyệt: Thực hiện kiểm tra chất lượng cơ bản trên toàn bộ dữ liệu xây dựng bằng cách áp dụng các tiêu chuẩn chất lượng nghiêm ngặt
- Kiểm tra chéo: Thực hiện phân nhóm và kiểm tra chất lượng chéo bằng cách áp dụng phương pháp K-fold cross-validation
- Phân phối cuối cùng của dữ liệu xây dựng
- Chỉ giao cuối cùng cho khách hàng đối với dữ liệu cuối cùng có chất lượng phù hợp
- Đối với khối lượng xây dựng không đủ, chỉ dữ liệu chất lượng cao được phân phối bằng cách xây dựng hơn 150% dữ liệu dư thừa