Download the PHP package 4n70w4/php-text-words-parser without Composer

On this page you can find all versions of the php package 4n70w4/php-text-words-parser. It is possible to download/install these versions without Composer. Possible dependencies are resolved automatically.

FAQ

After the download, you have to make one include require_once('vendor/autoload.php');. After that you have to import the classes with use statements.

Example:
If you use only one package a project is not needed. But if you use more then one package, without a project it is not possible to import the classes with use statements.

In general, it is recommended to use always a project to download your libraries. In an application normally there is more than one library needed.
Some PHP packages are not free to download and because of that hosted in private repositories. In this case some credentials are needed to access such packages. Please use the auth.json textarea to insert credentials, if a package is coming from a private repository. You can look here for more information.

  • Some hosting areas are not accessible by a terminal or SSH. Then it is not possible to use Composer.
  • To use Composer is sometimes complicated. Especially for beginners.
  • Composer needs much resources. Sometimes they are not available on a simple webspace.
  • If you are using private repositories you don't need to share your credentials. You can set up everything on our site and then you provide a simple download link to your team member.
  • Simplify your Composer build process. Use our own command line tool to download the vendor folder as binary. This makes your build process faster and you don't need to expose your credentials for private repositories.
Please rate this library. Is it a good library?

Informations about the package php-text-words-parser

Parse html text into sentences and words. Грамматический разбор html текста на предложения и слова

Purpose

Анализ слов в тесте для реализации каких-либо алгоритмов (например, похожести текстов) Использование индексатором для полнотекстового поиска, отображение фрагментов текста и подсветка найденных слов в результатах поиска

Features

  1. Получение всех слов в тексте в порядке их следования
  2. Получение всех предложений и слов в тексте в порядке их следования
  3. Получение уникальных слов в тексте с весами их появления в тексте
  4. Нормализация текста (описание см. ниже)
  5. Распределение абсолютных позиций слов к абсолютным байтовым позициям в нормализованном тексте
  6. Поддержка нескольких языков одновременно
  7. Работает с любыми языками мира, используемая кодировка — UTF-8.

Terminology

  1. Нормализованный текст — текст с сохранением регистра, с параграфами и переносами строк, но без html тэгов и сущностей, без знака табуляции, ударения, мягкого переноса строк
  2. Слово — последовательность букв или цифр (мешанина не допускается!)
  3. Абсолютная позиция слова — порядковый номер слова в нормализованном тексте
  4. Относительная позиция слова — порядковый номер слова относительно предложения в нормализованном тексте
  5. Байтовая позиция слова — смещение слова в байтах в нормализованном тексте

Example

$wp = new Text_WordsParser(array('Latin', 'Cyrillic'));
$html = file_get_contents('test.html');
$text = $wp->parse($html, $words, $sentences, $uniques, $offset_map);
var_dump($text, $words, $sentences, $uniques, $offset_map);

Useful links

  1. http://www.evertype.com/alphabets/index.html The Alphabets of Europe
  2. http://ru.wikipedia.org/wiki/TF-IDF Оценка важности слова в контексте текста
  3. http://morpher.ru/Description.aspx Технология автоматического склонения
  4. http://phpmorphy.sourceforge.net/dokuwiki/demo Библиотека морфологического анализа на PHP, демонстрация работы phpMorphy (введи, например, слово "родной" или "раздела")
  5. http://packages.python.org/pymorphy/ Морфологический анализатор

Project was exported from http://code.google.com/p/php-text-words-parser


All versions of php-text-words-parser with dependencies

PHP Build Version
Package Version
Requires php Version *
Composer command for our command line client (download client) This client runs in each environment. You don't need a specific PHP version etc. The first 20 API calls are free. Standard composer command

The package 4n70w4/php-text-words-parser contains the following files

Loading the files please wait ....