Download the PHP package sastrawi/tokenizer without Composer
On this page you can find all versions of the php package sastrawi/tokenizer. It is possible to download/install these versions without Composer. Possible dependencies are resolved automatically.
Download sastrawi/tokenizer
More information about sastrawi/tokenizer
Files in sastrawi/tokenizer
Package tokenizer
Short Description PHP library that allows you to tokenize Bahasa Indonesia.
License MIT
Homepage https://github.com/sastrawi/tokenizer
Informations about the package tokenizer
Sastrawi Tokenizer
Sastrawi Tokenizer adalah library PHP untuk melakukan tokenization pada Bahasa Indonesia.
Tokenization
Saya sedang belajar NLP Bahasa Indonesia.
Text di atas dapat di-tokenize menjadi:
Sastrawi Tokenizer
- Library PHP untuk melakukan tokenization pada Bahasa Indonesia.
- Mudah diintegrasikan dengan framework / package lainnya.
- Mempunyai API yang sederhana dan mudah digunakan.
Demo
http://sastrawi.github.io/tokenizer.html
Cara Install
Sastrawi Tokenizer dapat diinstall dengan Composer.
- Buka terminal (command line) dan arahkan ke directory project Anda.
- Download Composer sehingga file
composer.phar
berada di directory tersebut. - Tambahkan Sastrawi Sentence Detector ke file
composer.json
Anda :
Jika Anda masih belum memahami bagaimana cara menggunakan Composer, silahkan baca Getting Started with Composer.
Penggunaan
Melalui kode PHP
Copy kode berikut di directory project anda. Lalu jalankan file tersebut.
Melalui CLI (Command Line Interface)
Sastrawi-tokenize CLI membaca teks dari STDIN dan menulis token-tokennya ke STDOUT.
Untuk menampilkan bantuan:
Lisensi
Sastrawi Tokenizer dirilis di bawah lisensi MIT License (MIT). Library ini memuat daftar singkatan Bahasa Indonesia dengan lisensi Creative Common BY SA yang bersumber dari http://id.wiktionary.org/wiki/Wiktionary:Daftar_singkatan_dan_akronim_bahasa_Indonesia.
Informasi Lebih Lanjut
All versions of tokenizer with dependencies
sastrawi/string-span Version ~1
sastrawi/trka Version 0.*
symfony/console Version ~2.1