Jak wiadomo nie zawsze podstrony z formularzem rejestracyjnym są zaindeksowane. Często tworzy się footprinty do wyszukiwania adresów tak, aby pobrane adresy url z wyników wyszukiwania prowadziły od razu do podstrony rejestracyjnej. Jednak wtedy ucieka nam sporo innych adresów. Z kolei jak tworzymy footprinty do różnych podstron, to często trzeba znaleźć link do rejestracji. Sprawa jest na tyle prosta w przypadku np. Xrumera, że takich zabiegów nie trzeba robić, bo mod sam szuka podstrony rejestracyjnej. Jednak nie zawsze jest to dobre rozwiązanie!
Poniżej podaję gotowy skrypt w php do wyciągania linków, które posiadają w sobie określony ciąg znaków.
set_time_limit(3600); $linki = file('linki.txt'); $slowa = array( 'register', 'signup', ); foreach ($linki as $link) { $link = trim($link); if ( ! empty($link)) { $tresc = file_get_contents($link); preg_match_all('/href="(.*?)"/s', $tresc, $dopasowania); foreach ($dopasowania[1] as $anchor) { foreach ($slowa as $slowo) if (strstr($anchor, $slowo)) { if (strstr($anchor, 'http')) echo $anchor."<br>\r\n"; else { $link = parse_url($link); echo $link['scheme'].'://'.$link['host'].$anchor."<br>\r\n"; } } } } } |
set_time_limit(3600); $linki = file('linki.txt'); $slowa = array( 'register', 'signup', ); foreach ($linki as $link) { $link = trim($link); if ( ! empty($link)) { $tresc = file_get_contents($link); preg_match_all('/href="(.*?)"/s', $tresc, $dopasowania); foreach ($dopasowania[1] as $anchor) { foreach ($slowa as $slowo) if (strstr($anchor, $slowo)) { if (strstr($anchor, 'http')) echo $anchor."<br>\r\n"; else { $link = parse_url($link); echo $link['scheme'].'://'.$link['host'].$anchor."<br>\r\n"; } } } } }
W zmiennej $slowa podajemy ciągi znaków pod wyciąganie linków.
W pliku linki.txt podajemy adresy url, z których będą wyciągane linki.
Takie zabiegi łatwo robi się w programie UltraSeoMaster. Możemy ustawić wielowątkowość. Mój skrypt ma ograniczenia, ale dla osób, które nie posiadają tego programu może się przydać. Druga sprawa łatwiej się uczy PHP na gotowych skryptach :)
Przeczytaj Także:
- [Gotowiec: PHP] Wyciąganie adresów URL (i nie tylko) z komentarzy WordPress – Sztuczka! Kiedyś opublikowałem artykuł odnośnie tego jak dzięki spamerom wyłuskiwać adresy blogów auto approve (czytając ten artykuł zrozumiesz działanie poniższego skryptu). Oczywiście to tylko jeden przykład wykorzystania tej metody. Więcej przykładów...
- [Gotowiec: PHP] Wyszukiwanie i zamienianie ciągu znaków Ostatnio napotkałem na pewien problem w notepad++, a mianowicie musiałem wyszukać pewien ciąg znaków i go zamienić na inny ciąg znaków. Jak się szybko okazało w notepad++ mamy limit znaków...
- [Gotowiec: PHP] Porównywanie słów kluczowych (Words compare) Jakiś czas temu byłem zmuszony do usunięcia słów kluczowych z jednej listy na podstawie słów kluczowych z drugiej listy. Niestety tych słów było od groma, więc ręczne usuwanie, tak aby...
- [Gotowiec: PHP, JavaScript] Hidemyass Proxy Skrypt napisany w PHP i JavaScript do wyciągania darmowych, publicznych proxy ze strony Hidemyass.com. Kod wystarczy skopiować do pliku o rozszerzeniu .php i wgrać na serwer, a następnie odpalić. Po...
Na czym zarabiam ?
- Prolink - giełda linków tekstowych.
- SeoPilot - System sprzedaży linków tekstowych.
- Złoty program partnerski - złote myśli.
Dzięki za skrypt na pewno się przyda :)
14/07/2013 o 15:25
UltraSeoMaster bez niego to już nie potrafię pracować. Skrypt bardzo przydatny. Dzięki
16/07/2013 o 11:22
+ dla was. Bardzo dobry skrypt.
19/07/2013 o 09:11
Bardzo dobry skrypt.
22/07/2013 o 08:46
Bardzo przydatny skrypt! Wielkie dzięki.
25/07/2013 o 23:50
Również dziękuje :)
28/07/2013 o 14:48