Source code for underthesea.classification

# -*- coding: utf-8 -*-
from underthesea.classification.model_fasttext import FastTextPredictor
from underthesea.classification import bank


[docs]def classify(X, domain=None): """ Text classification Parameters ========== X: {unicode, str} raw sentence domain: {None, 'bank'} domain of text * None: general domain * bank: bank domain Returns ======= tokens: list categories of sentence Examples -------- >>> # -*- coding: utf-8 -*- >>> from underthesea import classify >>> sentence = "HLV ngoại đòi gần tỷ mỗi tháng dẫn dắt tuyển Việt Nam" >>> classify(sentence) ['The thao'] >>> sentence = "Tôi rất thích cách phục vụ của nhân viên BIDV" >>> classify(sentence, domain='bank') ('CUSTOMER SUPPORT',) """ if X == "": return None if domain == 'bank': return bank.classify(X) # domain is general clf = FastTextPredictor.Instance() return clf.predict(X)