Блог старого компьютера

Блог старого компьютера


Главная PHP Определить PageRank ресурса PHP

Определить PageRank ресурса PHP

20.11.2012 12:55 Администратор PHP
Печать PDF
Продолжаем тему сбора seo показателей. На этот раз будем определять google PageRank сайта. Возможно сейчас существуют более простые способы это сделать на php (ну к примеру парсить с какого нибудь SEO сайта, но этот способ мы отметаем сразу по причине того что нам нужно точное и прямое получение данных или же есть страница у гугла с которой можно забрать информацию без пляски с бубном). Так как я упомянул пляски с бубном то вы я думаю уже поняли что не так то просто будет определить PR сайта.

История написания кода очень похожа на эту историю, но это заблуждение. И так начнем.

В поисках страницы с которой можно на прямую получить  PageRank я наткнулся на следующую ссылку ну или возможно на аналогичную (уже не помню как и где я это нашел):

http://toolbarqueries.google.com/tbr?client=navclient-auto&hl=en&ch=762198071904&ie=UTF-8&oe=UTF-8&features=Rank&q=info:yandex.ru

Ссылка возвращала вот такой результат:

Rank_1:1:8

 На сколько помню такую же информацию выдают кнопки информеты от гугл. И тут я подумал что дело в шляпе и нужно просто написать очередной парсер и забрать нужную мне цифру. Попробовав подставить в ссылку другой сайт, ссылку вернула мне ошибку "403. That’s an error."  Рассмотрев ссылку повнимательней я понял что дело в передаваемом гет параметре ch=762198071904, но что это за число. После некоторых раздумий и поиском информации в интернете я понял что это CheckHash (проверка хеш) урл адреса. Попробовав самостоятельно сделать функцию  получения hash кода, я понял что это бесполезно. Хеш что у меня получался ни как не подходил. Пришлось обратится в поиск. В поиске я нашел работающее решение, но оно было не маленьким. Но так как ни чего получе у меня не было пришлось использовать его. Вообщем вот весь код в целом:

function StrToNum($Str, $Check, $Magic) {
$Int32Unit = 4294967296;
$length = strlen($Str);
for ($i = 0; $i < $length; $i++) {
$Check *= $Magic;
if ($Check >= $Int32Unit) {
$Check = ($Check - $Int32Unit * (int) ($Check / $Int32Unit));
$Check = ($Check < -2147483648) ? ($Check + $Int32Unit) : $Check;
}
$Check += ord($Str{$i});
}
return $Check;
}

function HashURL($String) {
$Check1 = StrToNum($String, 0x1505, 0x21);
$Check2 = StrToNum($String, 0, 0x1003F);
$Check1 >>= 2;
$Check1 = (($Check1 >> 4) & 0x3FFFFC0 ) | ($Check1 & 0x3F);
$Check1 = (($Check1 >> 4) & 0x3FFC00 ) | ($Check1 & 0x3FF);
$Check1 = (($Check1 >> 4) & 0x3C000 ) | ($Check1 & 0x3FFF);
$T1 = (((($Check1 & 0x3C0) << 4) | ($Check1 & 0x3C)) <<2 ) | ($Check2 & 0xF0F );
$T2 = (((($Check1 & 0xFFFFC000) << 4) | ($Check1 & 0x3C00)) << 0xA) | ($Check2 & 0xF0F0000 );
return ($T1 | $T2);
}

function CheckHash($Hashnum) {
$CheckByte = 0;
$Flag = 0;
$HashStr = sprintf('%u', $Hashnum) ;
$length = strlen($HashStr);
for ($i = $length - 1; $i >= 0; $i --) {
$Re = $HashStr{$i};
if (1 === ($Flag % 2)) {
$Re += $Re;
$Re = (int)($Re / 10) + ($Re % 10);
}
$CheckByte += $Re;
$Flag ++;
}
$CheckByte %= 10;
if (0 !== $CheckByte) {
$CheckByte = 10 - $CheckByte;
if (1 === ($Flag % 2) ) {
if (1 === ($CheckByte % 2)) {
$CheckByte += 9;
}
$CheckByte >>= 1;
}
}
return '7'.$CheckByte.$HashStr;
}

function getch($url) { return CheckHash(HashURL($url)); }

function urlpr($url){
$ch = getch($url);
$main_url = "http://toolbarqueries.google.com/tbr?client=navclient-auto&hl=en&ch=$ch&ie=UTF-8&oe=UTF-8&features=Rank&q=info:$url";
$content = file_get_contents($main_url);
$pr = explode(":",$content);
return "<div><b>PageRank ресурса:</b> ".$pr[2]."/10</div>";
}

 Довольно не маленький код на мой взгляд для опрделения PR. Пример его использования такой:

echo urlpr("yandex.ru");

 Вот сообственно и все, пользуйтесь на здоровье Smile

Добавить комментарий


Защитный код
Обновить

Поиск

Голосование

Что Вы думаете на счет битрикса?
 

Все материалы раздела