Hỏi Đáp Là gì

Pyvi là gì

Project description

Python Vietnamese Toolkit

Whats New [0.1]

Retrain a new tokenization model on a much bigger dataset. F1 score =0.985
Add training data and training code
Better integration to spacy.io [removing redundant spaces between tokens after tokenization. Eg. Việt Nam , 12 / 22 / 2020 => Việt Nam, 12/22/2020]

Functionality

Tokenization
POS tagging
Accents removal
Accents adding

Algorithm: Conditional Random Field

Vietnamese tokenizer f1_score = 0.985

Vietnamese pos tagging f1_score = 0.925

POS TAGS:

A - Adjective
C - Coordinating conjunction
E - Preposition
I - Interjection
L - Determiner
M - Numeral
N - Common noun
Nc - Noun Classifier
Ny - Noun abbreviation
Np - Proper noun
Nu - Unit noun
P - Pronoun
R - Adverb
S - Subordinating conjunction
T - Auxiliary, modal words
V - Verb
X - Unknown
F - Filtered out [punctuation]

Installation

At the command line with pip

$ pip install pyvi

Uninstall

$ pip uninstall pyvi

Usage

from pyvi import ViTokenizer, ViPosTagger ViTokenizer.tokenize[u"Trường đại học bách khoa hà nội"] ViPosTagger.postagging[ViTokenizer.tokenize[u"Trường đại học Bách Khoa Hà Nội"] from pyvi import ViUtils ViUtils.remove_accents[u"Trường đại học bách khoa hà nội"] from pyvi import ViUtils ViUtils.add_accents[u'truong dai hoc bach khoa ha noi']

Video liên quan

Bài Viết Liên Quan

Rau sạch nghĩa bóng là gì

Cốt san nền là gì

Thay loa laptop Dell giá bao nhiêu

Thép cs là gì

Làm thế nào để không suy nghĩ bậy bạ

Look to sb là gì

Có nên mua đất gần cao tốc

Vì sao trong cuộc khai thác thuộc địa lần thứ nhất của thực dân Pháp công nhân Việt Nam chỉ dừng lại

Vì sao nghiện rượu

Cấm luyến là gì

Pi Convention là gì

666 nghĩa là gì

Giòn tan tiếng Nhật là gì

Igbt trong biến tần là gì

Ra khỏi BCND nước nhận là gì

Tại sao không đăng bài lên Instagram được

Equity trong poker là gì

Làm sao biết micro bluetooth sạc đầy

Nguyên vật liệu mở là gì

Idiom trong tiếng Anh là gì

Toplist mới

#1

Top 8 nhận xét nào sau đây là đúng về phong trào đồng khởi (1959 -- 1960 ở miền nam việt nam) 2023

6 tháng trước

#2

Top 6 an toàn giao thông lớp 4 bài 2 2023

6 tháng trước

#3

Top 7 tư duy kế toán trưởng thực thụ 2023

6 tháng trước

#4

Top 7 điểm tín dụng hàng 8 có vay được không 2023

6 tháng trước

#5

Top 6 quyết định cho phép chuyển mục đích sử dụng đất 2023

6 tháng trước

#6

Top 9 kem zale sạm đỏ có tốt không 2023

6 tháng trước

#7

Top 7 bỏ trị mụn mini la roche-posay 2023

6 tháng trước

#8

Top 7 ủy ban nhân dân các cấp có quyền ban hành những loại văn bản pháp luật nào 2023

6 tháng trước

#9

Top 9 tinh dầu tràm có tác dụng gì 2023

6 tháng trước

Bài mới nhất

Bảng thanh toán tiền lương thông tư 200 năm 2024

Nhận nhầm người tiếng anh là gì năm 2024

Bạn giống người nổi tiếng nào ở trung quốc năm 2024

Ruột già có tiêu hóa cơ học không năm 2024

Bình định thuộc miền trung hay nam năm 2024

Baảo việt sử dụng phần mềm quản lý nào năm 2024

Hệ sinh thái công nghệ là gì năm 2024

Các ví dụ về hàng hóa thay thế năm 2024

Xét nghiệm sinh hóa là gì năm 2024

Trứng lòng đào tiếng anh là gì năm 2024