Я хочу создать этот движок, который будет классифицировать веб-сайты на основе их мета-атрибута ключевого слова.
Извлечение ключевого слова с веб-сайта было таким же простым, как и подключение к базе данных. Проблема, с которой я столкнулся, заключается в алгоритме сопоставления «ключевого слова», извлеченного с веб-сайта, с предопределенным набором строк.
Помогите пожалуйста мне. Я использую PHP-скрипты для реализации этого.
//say I have $pattern as the meta keyword extracted from web page (ignore the syntax – please me)
$pattern=<news, current affairs, breaking news, sports, entertainment, daily news, local news>
// and set of predefined string to match with..
$keywords=<----something----->
Какую логику я должен использовать для сопоставления $pattern
с $keywords
? Работает ли у меня функция preg_match_all()
или 'ereg
'? Пожалуйста, помогите мне, ребята.
$keyword=array('местные новости','искусство','местный','мир','технологии','развлечения','новости','технологии','главные новости','в новостях',' главная страница», «новости BBC», «взгляд на неделю», «неделя в картинках», «главные новости»); //$keyword имеет предопределенный массив строк $all_meta_tags=get_meta_tags("http://abcnews.go.com/"); $array=$all_meta_tags['keywords'];//сохраняем значения атрибута 'keyword' в $keyword_meta
Теперь мне нужно сопоставить содержимое массива $ с ключевым словом $..... результаты должны дать мне совпадающие элементы массива $, которые присутствуют в ключевом слове $