karanlık proxyscrape logo

Google arama sonuç sayfaları (SERP'ler) nasıl kazınır?

Nasıl yapılır, Kazıma, Ağustos-01-20215 dakika okuma

It needs no introduction that Google is the widely used platform for search-related queries of people across the globe. According to the Statista website, Google’s share of the global search market is 87.35%. Further, the stats have shown that Google exceeds 2 trillion users annually, indexing over 130 trillion pages.  These statistics prove that Google

Google'ın dünyanın dört bir yanındaki insanların arama ile ilgili sorguları için yaygın olarak kullanılan bir platform olduğunu tanıtmaya gerek yok. Statista web sitesine göre Google'ın küresel arama pazarındaki payı %87,35'tir. Ayrıca, istatistikler Google'ın yılda 2 trilyon kullanıcıyı aştığını ve 130 trilyondan fazla sayfayı indekslediğini göstermiştir. 

Bu istatistikler, Google'ın SERP'leri hakkında internet pazarlamacıları ve diğerleri için değerli olan kapsamlı kamuya açık verilere sahip olduğunu kanıtlamaktadır. Dolayısıyla SERP'leri kazımak internet pazarlamacıları arasında bir öncelik haline geldi. Ancak, belirli bir istek miktarını aştığınızda, Google IP adresinizi engelleyecektir.

Bu yüzden bu makale, engellenmeden SERP'leri nasıl kazıyacağınızı inceleyecek. Bundan önce, web kazımanın temellerini ele alacağız.

Web kazıma nedir?

Birkaç web sayfasından büyük bir veri kümesini kopyalamanız gerektiğini varsayalım. İlk başta, içeriği kopyalayıp bir elektronik tabloya yapıştırmak isteyebilirsiniz. Ancak, büyük bir web belgesi olduğu için, verileri manuel olarak ayıklamak zaman alıcı olacaktır. Bu nedenle, kazıma işlemini otomatikleştirmeniz gerekir, bu da size bolca zaman kazandıracaktır.

Bu veri kazıma otomasyon süreci web kazıma olarak bilinir. Bu yöntemle, web sitesi URL'sini bir tarayıcıya girmeden HTML kaynağını indirebilirsiniz.

Web kazıma hakkında daha fazla bilgi edinmek için burayı okuyabilirsiniz. 

Arama Motoru Sonuç Sayfaları (SERP) kazıma nedir?

Tıpkı web kazıma gibi, SERP kazıma da bir dizi anahtar kelime için yapılan Google aramasından ilk 10 veya daha fazla sonucu çıkarma işlemidir. Çoğu Arama Motoru Optimizasyonu (SEO) şirketi, müşterilerinin web sitelerinin hedeflenen anahtar kelimeler için sıralamalarını izlemek için bu tekniği kullanır. 

SERPS için kazıma yapmanın reklam doğrulama, potansiyel müşteri oluşturma ve içerik toplama gibi başka nedenleri de olabilir.

Genellikle, SERP'ler için kazıma yapmak için otomasyon araçları vardır, bunları bu makalenin ilerleyen bölümlerinde öğreneceksiniz. Alternatif olarak, Python gibi programlama dillerini kullanarak kendi komut dosyanızı oluşturabilirsiniz. Ancak, bunu yalnızca kodlama konusunda kendinize güveniyorsanız ve daha yüksek teknik uzmanlığa sahipseniz yapabilirsiniz. Ayrıca, Google SERP'lerini kazımak için cURL 'yi de kullanabilirsiniz.

Bu araçlar ilgili web sayfalarından veri topladıktan sonra bunları Veritabanları, CSV dosyaları, XML veya JSON dosyaları için kaydederler. Daha sonra bu veriler, SEO çabalarınızın doğru çalışıp çalışmadığını belirleyebileceğiniz yapılandırılmış bir formatta olur. Bunun nedeni, sayfanızın zaman içindeki yerleşimlerini görebilmenizdir.

Ayrıca, SERP'ler yalnızca metinsel içeriklerden değil, aynı zamanda resimlerden, videolardan, öne çıkan snippet'lerden, yerel arama haritalarından ve çok daha fazlasından oluşur.

Bir sonraki bölümde, SERP'lerden kazıma yapmanın önemli bir faydasını keşfedeceksiniz.

SERP'leri kazımak, bilgisayar korsanlarının neden olduğu hasarı gidermenize nasıl yardımcı olur?

Hacklenmek sizi her zaman olumsuz etkileyen bir şeydir. Hacklenen web siteniz ve giriş bilgileriniz dark web'e düşebilir. Bilgisayar korsanları backlink bile satabilir veya sitenizde dark web kötü amaçlı yazılımları çalıştırabilir. Aynı şekilde, hacklenmenin SEO bağlamında da olumsuz bir etkisi vardır.

Google'daki SERP'leri kazımanın önemli faydalarından biri, bilgisayar korsanlarının neden olabileceği potansiyel zararları belirleme yeteneğidir. SERP'lerde SEO sıralamalarınızı elde etmek için çok çalıştığınızda, bilgisayar korsanları güvenlik ayarlarınıza kolayca sızabilir ve tüm SEO çabalarınızı mahvedebilir. 

Bilgisayar korsanlarının SEO çalışmalarınızı nasıl ele geçirdiğine ilişkin kapsamlı ayrıntıları burada bulabilirsiniz.

Yapılan bir ankete göre, SEO uzmanlarının %48 'i Google'ın SERF sonuçlarının orijinal halini geri kazanmasının aylar sürdüğünü belirtmiştir. 

Web siteleriniz için SERP'leri takip etmek, sıralamalarınızda neler olup bittiği hakkında yararlı bilgiler sağlar. Ayrıca, saldırı girişimleri sırasında sıralamalarınızın olası sonuçlarını belirlemenize de yardımcı olurlar. Bu nedenle Google'dan hızlı bir şekilde önceki sıralamalarınıza geri dönmesini talep edebilirsiniz. Sonuç olarak, sitenizin kapalı kalma süresi ve arama motorları sıralamasındaki düşüşler büyük ölçüde en aza indirilecektir.

Öte yandan, web sitenize Kötü Amaçlı Yazılım bulaştığında, bu durum arama motoru sıralamalarınızı olumsuz etkileyecektir. Sitenizin kara listeye alınma olasılığı da daha yüksek olacaktır. Godaddy'ye göre, bu durum daha çok küçük işletme web siteleri için geçerlidir. Godaddy sitelerinin %90 'ı Malware'in kendilerine bulaştığını bilmiyordu.

Bu nedenle, tüm SERP'lerinizi sürekli olarak kazımak, olası saldırı girişimlerini önceden tespit etmenizi sağlar ve Google'ın sonuçlarınızı geri yüklemesine kesinlikle yardımcı olur.

Google arama sonuçları nasıl kazınır?

Daha önce de belirttiğim gibi, Google SERP'lerini kazıyabileceğiniz çeşitli yollar vardır. Bu bölümde, bunu yapmanın birkaç yolunu keşfedeceksiniz.

Görsel Web Kazıyıcı

Octoparse

Bu, Google SERP'lerini kazımak için kullanabileceğiniz genel bir web kazıyıcı aracıdır. Sadece SERP'leri kazımakla kalmaz, aynı zamanda Google haritalarından veri kazımakta da iyidir.

Octoparse'ın kritik özelliklerinden biri, hedef web siteleri tarafından öne sürülen kazıma karşıtı önlemlerden akıllıca kaçınmasıdır. Ayrıca, görsel kazıma aracını kullanmak için bir programcı olmanızı gerektirmez. Kullanımı oldukça kolaydır ve bulut tabanlı bir çözümün yanı sıra yüklenebilir bir yazılım olarak da mevcuttur.

Octoparse hakkında daha fazla bilgiye buradan ulaşabilirsiniz.

Tarayıcı uzantısı

Webscraper.io 

Webscraper.io, Google Chrome web tarayıcısı için ücretsiz bir uzantıdır. Google web sayfalarından HTML ve CSS biçiminde veri çıkarabilir. Daha sonra verileri CSV formatında dışa aktarabilir. Tarayıcı uzantısı sürümü tamamen ücretsizdir ve kazıma faaliyetlerinizi yönetmek için yeterlidir. Bulut tabanlı seçeneği tercih ederseniz, bu bir maliyete neden olacaktır.

Ayrıca bununla Google haritalarını çıkarabilir ve bunları bir Veritabanına dönüştürebilirsiniz. Bu uzantı hakkında daha fazla bilgiyi burada bulabilirsiniz.

Google Arama API'si

Google'ın arama motorundan veri almak için resmi bir yol sunduğunu biliyor muydunuz? Aşağıda belirtildiği gibi sınırlamaları olmasına rağmen, SERP verilerine ihtiyaç duyan herkes için şu anda kullanılabilir. İşte sınırlamaları:

  • Görsel web kazıyıcı, tarayıcı uzantıları veya diğer web kazıma araçlarına kıyasla sınırlı bilgi sağlar.
  • Google, tek bir web sitesini veya daha az sayıda web sitesini aramak amacıyla geliştirmiştir. Ancak, tüm World Wide Web'de (WWW) arama yapmak için yapılandırabilirsiniz, bu da çok fazla teknik uzmanlık gerektirir.
  • Yığınla talep göndermek size bir servete mal olacağı için delicesine pahalıdır.

Dolayısıyla, sınırlamaları ve maliyetleri ile Google arama API'si SERP sonuçlarını kazımak için ideal bir platform değildir. Bu makale boyunca bahsedilen alternatif yöntemleri kullanmak her zaman daha iyidir.

Python, requests ve BeautifulSoup kullanımı

Python ile kodlama konusunda uzman olanlarınız için bu yöntem kullanışlı olacaktır. Kuşkusuz ilk etapta maliyeti düşürür ve daha fazla kontrole sahip olursunuz.

Bu programda, "Python nasıl öğrenilir" arama sorgusu için SERP'leri çıkaracağız. İşleri daha basit hale getirmek için, arama sorgusunu sabit kodlayacağız. Daha sonra sonuç kümesini çektikten sonra, sonuçların başlığını yazdıracağız. Hadi başlayalım.

import requests
from bs4 import BeautifulSoup
import random
 
text = 'How to learn Python programming'
url = 'https://google.com/search?q=' + text
useragent = ("Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 Safari/537.36"
       )
 
Agent = useragent[random.randrange(len(useragent))]
 
headers = {'user-agent': Agent}
req = requests.get(url, headers=headers)
 
soup = BeautifulSoup(req.text, 'lxml')
for info in soup.find_all('h3'):
    print(info.text)
    print('__________')
 

Burada her bir kod satırını net bir şekilde açıklayacağım:

i̇thalat talepleri̇

SERP'i indirmek için Python'un istek kütüphanesini kullanıyoruz. Daha sonra request modülü Google sunucusuna bir get isteği gönderiyor. Bu, programın SERP'in HTML içeriğini indirmesini sağlar.

from bs4 import BeautifulSoup

Daha sonra BeautifulSoup kütüphanesini yükleyen aşağıdaki satır kendini açıklayıcıdır. Bu kütüphane HTML ve XML belgelerini ayrıştırmayı mümkün kılar.

text = 'Python programlama nasıl öğrenilir'
url = 'https://google.com/search?q=' + metin

Bu kod parçası, verilerin kazınacağı arama motorunun URL'sini ayarlar. Bu yüzden URL'yi google.com olarak ayarladım ve arama sorgusu için metin değişkenindeki metni, 'Python programlama nasıl öğrenilir' arama sorgusu olarak ekledim.

useragent = ("Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, Gecko gibi) Chrome/92.0.4515.107 Safari/537.36" )

      

Ardından yukarıdaki kod kullanıcı aracısı dizesini ayarlar.

req = requests.get(url, headers=başlıklar)

Yukarıdaki kod, arama sonuçlarının istenen HTML içeriğini indirmek için web sunucusuna istek gönderir.

soup = BeautifulSoup(req.text, 'lxml')

Yukarıdaki kodun 'lxml' ayrıştırma başlıklarından talep ettiği verilerle bir BeautifulSoup örneği oluşturun. Yukarıdaki kodun çalışması için önce 'lxml' paketini yüklemelisiniz.

for info in soup.find_all('h3'):
    print(info.text)
    print('__________')

Ardından bir for döngüsü kullanılarak, başlıkları görüntülemek için tüm h3 etiketleri çıkarılır.

Google SERP'lerini kazımak için konut proxy'lerini kullanma

Daha önce de belirtildiği gibi, Google gibi arama motorları, kazıma sınırını aştığınızda IP adresinizi yasaklamak da dahil olmak üzere kısıtlamalar getirmektedir. İşte bu noktada proxy'ler IP adresinizi maskelemede çok önemli bir rol oynar. Piyasadaki tüm proxy'ler arasında, konut proxy'leri ideal seçimdir. Bunun nedeni, IP'lerinin gerçek konut sahiplerinden kaynaklanmasıdır.

Ancak, ilk birkaç SERP'i kazdığınızda, Google eylemlerinizin insanlık dışı olduğunu fark edecektir. Ardından proxy'nizin IP adresini engelleyecek ve captcha'larla uğraşmak zorunda kalacaksınız.

İşte bu noktada konut proxy'leri ağı kurtarıcınız olur. Konut proxy'lerinden oluşan bir ağ kullandığınızda, her birinin benzersiz bir IP adresi olacaktır. Böylece IP adreslerini döndürerek SERP'lerden kazıma yapabileceksiniz. Böylece eylemleriniz arama motoruna insan gibi görünecektir.

Konut vekillerinin ayrıntılı bir açıklaması için lütfen bu makaleye bakın.

Google SERP'lerini kazımak için konut proxy'lerini kullanmanın yasal sonuçları

Şimdiye kadar, Konut proxy'lerinin ne olduğu ve IP yasaklarının üstesinden gelmenize nasıl yardımcı olabilecekleri konusunda net bir fikriniz olmalı. Şimdi, Google'ın SERP'lerinden kazıma yaparken birçok kullanıcının ihmal ettiği çok önemli bir faktörü inceleyeceğiz. Bu, konut proxy'lerini kullanmanın yasal sonuçlarıdır.

Her şeyden önce, Google SERP'lerini kazımak için konut proxy'leri kullanmak yasaldır. Bunu göz önünde bulundurarak, Google gibi arama motorlarına sınırsız istek göndermek cazip gelebilir. Bu durumda, Google'ın sunucuları çok sayıda istekle aşırı yüklenmiş olur. Bu, Google SERPs algoritmasına göre bile yapılacak doğru şey değildir.

Bu nedenle, veri kazıyacağınız hedef web sitesine veya arama motoruna her zaman saygılı olduğunuzdan emin olmanız gerekir. Ayrıca, kazıyıcınızın hedef arama motoruna saygılı olması da dahil olmak üzere mümkün olan en iyi kazıma uygulamalarını kullanmanız gerekir.

Siz veya proxy sağlayıcınız hedef web sunucusundan bir şikayet alırsanız, istekleri derhal sınırlandırmalı veya kazıma işlemini durdurmalısınız. Şikayet, hedef web sunucusunun sınırsız istekleriniz nedeniyle yüksek bir iş yükü yaşıyor olabileceği yönünde olabilir. Bu nedenle bu tür gerçeklere karşı dikkatli olmanız gerekir.

Sıkça Sorulan Sorular

Google'dan kazıma yapmak yasa dışı mı?

Genellikle Google, kazıyıcıların kendisinden veri çalmasından hoşlanmaz. Bu makalede defalarca belirttiğim gibi, IP adreslerinizi yasaklayabilir. Ayrıca, bugüne kadar Google, verilerin aşırı kazınması için herhangi bir işlem yapmadı. Açıkçası, Google bu tür eylemlerde bulunursa SEO şirketlerinin bir çıkışı olmayacaktır.

Sonuç

Artık web kazıyıcılarının SERP'lerden veri kazımak için kullandıkları farklı yöntemler hakkında genel bir bilgi edindiğinizi umuyoruz. Son olarak, SERP'leri kazımak için konut proxy'lerini yasal sonuçlarıyla birlikte nasıl kullanabileceğinizi öğrendiniz.

Bu makaleyi faydalı bulacağınızı umuyoruz ve daha fazla makale için bizi izlemeye devam edin.