Unlimited $1.99 domain names - We use goDaddy $ 1,99 ilimitado de nombres de dominio - Usamos goDaddy
Powered by MaxBlogPress Powered by MaxBlogPress

Cómo Mantener los piensos Rascadores, spam y Splogs Robo De Su Contenido | JTPRATT errores del Blogging
JTPratt errores de los blogs





Home Inicio » How to Keep Feed Scrapers, Spammers, and Splogs From Stealing Your Content »Cómo Mantener Rascadores de alimentación, spam y Splogs Robo De Su contenido



Posted in: Publicado en:

blog-categoría de contenido de imagenblog-configuración de la categoría de imagen
781 views 781 visitas


Please note: This page was originally written in English. Por favor nota: Esta página fue originalmente escrito en Inglés.

The original post can be viewed El post original se puede ver here aquí .

Please note: This page was originally written in English.

The text has been translated using an online service such as Google or Babelfish.

The original post can be viewed here.


You may not know it, but criminals and thieves are waiting for you to write your next blog post. Puede que no lo sepa, pero los delincuentes y los ladrones están esperando para que usted escriba su próxima entrada en el blog. They’re waiting so they can scrape your feed and weave it into their spam splog hoping to either build links for illicit sites or make quick bucks doing nothing on Made for Adsense of MFA sites. Están esperando a fin de que puedan raspar su alimentación y tejer en sus splog spam, ya sea con la esperanza de construir enlaces para sitios ilícitos o hacer dinero rápido no hacer nada en Hecho para Adsense sitios de la AM. I’ll show you how to beat them and use your already existing .htaccess file. Le mostraré cómo los golpearon y utilizar su ya existente. Htaccess. Whether you’ve been blogging for a long or short time you should be able to spot spammers a mile away. Si usted ha sido el blog de un largo o corto período de tiempo debe ser capaz de detectar los spammers a una milla de distancia. If not - I’m going to help you figure it out. Si no - Yo te voy a ayudar cifra a cabo.

There are 3 ways I have to check for spam. Existen 3 maneras tengo para comprobar si el spam. The first is in my Wordpress dashboard “incoming links”. El primero es en mi tablero de Wordpress "enlaces entrantes". If you don’t use Wordpress, that’s ok - all you have to do is go to Si no utiliza Wordpress, que bien - todo lo que tienes que hacer es ir a la Google Blogsearch Google blogsearch and do a search for “link:www.yoursitename.com”. y hacer una búsqueda de "link: www.yoursitename.com". That’s where Wordpress gets it’s results. Ahí es donde se Wordpress es resultados.

Próximos enlaces

You can’t always tell what’s spam just from the titles, but in this case - I think the first result is plainly spam. No se puede decir siempre lo que es spam sólo de los títulos, pero en este caso - Creo que el primer resultado es claramente spam. Here’s what I saw when I clicked on the link… Esto es lo que vi cuando me hizo clic en el enlace ...

Splog ejemplo

The splog is a scraper of the worst kind - the kind that steals your entire posts (images and all). El splog es un rascador de la peor especie - el tipo que roba toda su puestos (y todas las imágenes). This post contains a link to my blog, but actually it’s not a post of mine at all. Este post contiene un enlace a mi blog, pero en realidad no es un puesto de las minas en absoluto. This is a post written by Alan over at Este es un post escrito por Alan en más de Affiliate Confession Confesión de Afiliados , and he just happenned to link back to my site. , Y que acaba de happenned de vincular de nuevo a mi sitio. You can find lots of spammers and scrapers by looking at who’s linking to your site. Usted puede encontrar gran cantidad de spammers y raspadores mirando en que la vinculación a su sitio.

The second way I check for scrapers leeching my rss feed is by the comments I receive. La segunda manera de comprobar Sanguijuelas rascadores mi feed RSS es por los comentarios que recibo. Sure, you can receive spammy comments on your blog, but scrapers leave spammy “trackbacks” just like the droppings from a foul animal. Claro, usted puede recibir spammy comentarios en su blog, pero rascadores licencia spammy "Trackbacks" al igual que los excrementos de un animal sucio. I can hear a few people in the background asking “what’sa trackback?”. No puedo escuchar unas pocas personas en el fondo preguntando "¿Qué es TrackBack?". A trackback is kind of like an “auto-comment”. A TrackBack es como un "auto-observación". A scraper site steals your content using your RSS feed or directly from your page, and then it attempts to communicate with your blog by sending a “ping” for a trackback. Un rascador sitio roba su contenido a través de su feed RSS o directamente desde tu página y, a continuación, intenta comunicarse con su blog mediante el envío de un "ping" de un TrackBack. Normally a blogger (or his blog software) might send out a “ping” manually or automatically to every URL linked in the latest post. Normalmente, un usuario de Blogger (su blog o software) puede enviar un "ping" manual o automáticamente a todas las URL vinculadas en el último puesto. The trackback comes into your blog as a comment that you have to approve. El TrackBack entra en tu blog como un comentario de que usted tiene que aprobar.

Trackbacks ejemplo

In the example above I actually received 3 trackbacks during the night I caught this morning - which prompted my to write this article. En el ejemplo anterior he recibido 3 Trackbacks durante la noche Cogí esta mañana - que le pida a mi escribir este artículo. The first one was obvious without even clicking that is was a spam trackback from the inappropriate keywords in the link title. El primero de ellos era evidente sin siquiera hacer clic en que era un spam TrackBack de la inadecuada palabras clave en el vínculo título. The third was a post I recognized posting a comment on myself yesterday, so I knew that one was good. El tercer puesto fue un desplazamiento reconocí un comentario sobre mí el día de ayer, así que sabía que era una buena. The second one I had to click on to see if it was spam or not. El segundo tuve que hacer clic en para ver si es spam o no.

robo de contenido ejemplo

Once I clicked on it, at first I didn’t think it was my content at at all. Una vez que hace clic en él, en un primer momento no pensé que era mi contenido en en absoluto. You can see in the first paragraph above the first paragraph is about sports. Usted puede ver en el primer párrafo anterior, el primer párrafo se refiere a los deportes. But the second paragraph (and the rest of the page) was clearly from one of my posts. Sin embargo, el párrafo segundo (y el resto de la página) era claramente de una de mis entradas. You can see in the earlier trackback example image that after each trackback is a link to the page that was “tracked back to” (stolen). Usted puede ver en el ejemplo anterior TrackBack imagen que después de cada TrackBack es un enlace a la página que fue "un seguimiento de volver a" (robados). The content that was stolen on this splog was from my El contenido que fue robado en este splog fue de mi How to Earn Money Using Affiliate eBay Wordpress plugin BayRSS Cómo ganar dinero usando de afiliados de eBay Wordpress plugin BayRSS post. puesto.

So - why was the first paragraph not my content? Por lo tanto, - ¿por qué fue el primer párrafo no mi contenido? Look at it, that first paragraph has a link to auto insurance, and further down in the content (not pictured) are links to home equity loans, and business hosting. Míralo, párrafo primero, que tiene un vínculo con el seguro de automóviles, y más abajo en el contenido (no la foto) son enlaces a la home préstamos, y las empresas de alojamiento. This is what they call an “auto-blog” or “re-blog” what “spins content”. Esto es lo que ellos llaman un "auto-blog" o "re-blog" lo que "gira contenido". I will mix your original posts (and links and images) and “spins” it together with some real content it gets from another source (to make it’s page “original content”) and then inserts important links in key points. Voy a su original mezcla de puestos (y los enlaces e imágenes) y "spins" junto con algunos de contenido real, el fichero es de otra fuente (para que sea la página de "contenido original") y, a continuación, introduce importantes vínculos en puntos clave. The spammer either makes money from link building (as in this example) or from adsense (in the earlier example). El spammer hace bien el dinero de la construcción de enlace (como en este ejemplo) o de adsense (en el ejemplo anterior).

The third and last way I check for scrapers stealing my blog content is by using “google alerts”. La tercera y última manera de comprobar el robo de rascadores contenido de mi blog es mediante el uso de "Alertas de Google". It basically works the same as the google blogsearch earlier, except it can search a bit more AND it sends you automatic emails daily with the results. Básicamente funciona de la misma como el google blogsearch anterior, excepto que puede buscar un poco más y se le envía automáticamente mensajes de correo electrónico diario con los resultados. All you have to do is set a google alert for the name of your domain. Todo lo que tienes que hacer es establecer una alerta de Google por el nombre de su dominio. I set one for “www.jtpratt.com”. I un conjunto de "www.jtpratt.com". You can set your own at Usted puede fijar su propia en google alerts Alertas de Google .

Alertas de Google ejemplo

The example above is a google alert I got last weekend. El ejemplo anterior es una alerta de Google tengo el fin de semana pasado. Look like it’s just an alert of my own post, until you look at the URL below (videositemap). Parece que es sólo una descripción de mi puesto, hasta que usted busca en la siguiente URL (videositemap). I know this is spam without even clicking. Sé que esto es spam sin siquiera hacer clic.

So now we’ve identified spam and some scrapers stealing our content. Así que ahora hemos identificado el spam y el robo de algunos raspadores nuestro contenido. What to do about it? ¿Qué hacer al respecto? I’m going to show you how to use your .htaccess file. Voy a mostrar cómo utilizar el archivo. Htaccess. Read this post Lee este post about .htaccess at Plagiarism Today Acerca de. htaccess plagio en la actualidad . It explains what an .htaccess file is, and how to use it to prevent people from not only stealing your content, but also images and files (and your bandwidth) as well. Es lo que explica una. Htaccess es, y cómo usarlo para evitar que la gente no sólo de robar su contenido, sino también imágenes y archivos (y su ancho de banda), como así. If you use Wordpress (or other blogging software), chances are you already have an .htaccess file in the root of your site, because that’s how your blog changes the pages or ?p=382 into pretty permalinks or URL’s like /my-post-about-dogs. Si utiliza Wordpress (u otro software de blogs), es probable que usted ya tiene uno. Htaccess en la raíz de su sitio, porque así es como cambia tu blog o las páginas? P = 382 en muy perm o URL como / mi-post-sobre-perros. All you have to do is add some additional code to that file directing your web server who to let in, and who to throw out! Todo lo que tienes que hacer es añadir código adicional a ese archivo la dirección de su servidor web para permitir que en, y que a tirar! If scrapers can’t get to your content, they can’t scrape it! Si no rascadores puede llegar a su contenido, que puede que no raspe!

There are many, many ways to block, redirect, and stop scrapers by putting code in your .htaccess file, but I prefer the method in that article… Hay muchas, muchas maneras de bloquear, reorientar, y dejar de rascadores, poniendo en su código. Htaccess, pero prefiero el método en que el artículo ...

 order allow,deny deny from xxx.xxx.xxx.xxx allow from all 

Now, the x’s aboe need to be turned in to numbers (you can use multiple lines). Ahora, la x del aboe necesidad de ser convertido en números (que puede utilizar varias líneas). The number needs to be the IP address of the server you want to turn away. El número tiene que ser la dirección IP del servidor que desea a su vez lejos. So - we need to find out the IP addresses of the 2 scraper splogs we found earlier. Por lo tanto, - tenemos que averiguar las direcciones IP de los 2 rascador splogs hemos encontrado antes. There are many ways to do this, I do mine on the command line using “nslookup” - however you can use a web based tool, Hay muchas maneras de hacer esto, lo hago mío en la línea de comandos utilizando "nslookup" - Sin embargo usted puede utilizar una herramienta basada en web, like the one from zoneedit.com al igual que el de un zoneedit.com for free. de forma gratuita. Just enter the domain you want to lookup. Sólo tienes que introducir el dominio que desea buscar. I found the IP of videositemap.com is 70.87.226.18. He encontrado la IP de videositemap.com es 70.87.226.18. Now I need to get the one for fantasyfootballpassport.com, which is 216.139.234.32. Ahora tengo que conseguir el uno para fantasyfootballpassport.com, que es 216.139.234.32. Now I update my code to add to my .htaccess file with that information like this… Ahora actualizar mi código para agregar a mi. Htaccess archivo con esa información como esta ...

 order allow,deny deny from 70.87.226.18 deny from 216.139.234.32 allow from all 

I added that code to the top of my .htaccess file before anything else, uploaded it back to my web site root, and then visited my blog in both firefox and IE to make sure it loaded properly. He añadido este código al principio de mi. Htaccess antes que cualquier otra cosa, subido de nuevo a mi sitio Web raíz y, a continuación, visitaron mi blog en Firefox y IE para asegurarse de que ha cargado correctamente. Now, those 2 scrapers won’t be getting to my content again. Ahora, los 2 rascadores no se llegar a mi contenido de nuevo. While I prefer to block the scrapers I know regularly come to my blog, you can be proactive and use block lists of known spam and scraper sites to prevent plagiarism before it happens. Aunque yo prefiero a bloquear la rascadores Sé que regularmente llegan a mi blog, usted puede ser proactivos y utilizar listas de bloqueo de spam conocidos y rascador para evitar los sitios plagio antes de que suceda.

Some site owners and bloggers prefer to block “user agents” instead of IP address of computers, because IP’s (when found out) can be changed. Algunos propietarios de sitios web y los bloggers prefieren bloque "agentes de usuario" en lugar de la dirección IP de los ordenadores, porque la IP (cuando se enteró) se puede cambiar. This is a little different, because you have to have access to your “raw access log” on your server to search for bad user agents crawling your feed or content. Esto es un poco diferente, porque tienes que tener acceso a su "registro de acceso en bruto" en su servidor para buscar mala agentes de usuario rastrear su contenido o los piensos. What is a “user-agent”? ¿Qué es un "user-agent"? Simple, when you visit a site it may say that your “user-agent” is a paticular version of Firefox or Internet Explorer. Simple, cuando usted visita un sitio que puede decir que su "user-agent" paticular es una versión de Firefox o Internet Explorer. Google’s search crawler comes in on the user-agen “googlebot”. De búsqueda de Google llega en el rastreador de la Agen-usuario "googlebot". Nefarious scraper robots and indexers have known names, and you can block them by their user-agent name instead of their IP address. Rascador nefastas robots y indizadores han conocido los nombres, y puede bloquear por su user-agent nombre en lugar de su dirección IP.

As I said, I am blocking scrapers using the method I just showed you, but there are many other ways to do it - all from your htaccess file. Como ya he dicho, me bloqueo rascadores utilizando el método Yo sólo le mostró, pero hay muchas otras maneras de hacerlo - todo desde su htaccess. I’m going to give you a list of resources you can check out to get more information if you’re interested. Voy a darte una lista de recursos puede consultar para obtener más información si usted está interesado.

Fighting Scrapers and Splogs Resource List La lucha contra el raspadores y Splogs lista de recursos

How to Block Bots, Ban IP Addresses with .htaccess ¿Qué Bloquee a los Bots, la prohibición de direcciones IP con. Htaccess
.htaccess - Blocking IP Addresses, Robots, and Offline Browsers . htaccess - Bloqueo de direcciones IP, Robots, y sin conexión Navegadores
Blocking Bad Bots and Site Rippers (Offline Browsers) El bloqueo de los robots y mal sitio Rippers (navegadores fuera de línea)
Ultimate .htaccess Blacklist 2 Ultimate. Htaccess lista negra 2
Joe Maller .htaccess blacklist Joe Maller. Htaccess lista negra
How You Can Stop Dirty Feed Scrapers in 3 Easy Steps ¿Cómo se puede dejar de alimentar sucia rascadores en 3 sencillos pasos
Block Website Content Thieves, Proxy Services & Exploited Servers, with this Apache Server “.htaccess” Blocklist Bloque de Contenido Web para ladrones, Proxy de Servicios de Servidores y Explotados, con este servidor Apache ". Htaccess" lista de bloques

As always, if you have something to add to make this article better, or a question - please comment now! Como siempre, si tiene algo que añadir a este artículo hacer mejor, o una cuestión - por favor comentario ahora!


Tags: , , ,

4 Responses to “How to Keep Feed Scrapers, Spammers, and Splogs From Stealing Your Content” 4 Responses to "¿Cómo Mantener Rascadores de alimentación, spam y Splogs Robo De Su Contenido"

  1. Layne | Reward Rebel Layne | recompensar a rebeldes Has the following to say... Tiene las siguientes decir ...

    I’d just been checking out a splog that hit RR yesterday, so your article is (once again) very timely! Me acaba de comprobar un splog que azotó ayer RR, de modo que su artículo es (de nuevo) muy oportuna! How d’ya do that? ¿Cómo ya de hacer eso? =;;

    I’ve now signed up for Google Alerts on my domains - thanks for the tip - and I’m now going to take a peek at this .htaccess file coding - but I’m shaking already! He firmado hasta ahora por las alertas de Google sobre mis dominios - gracias por la punta - y estoy ahora va a tener una mirada a esto. Htaccess archivo de codificación - pero yo ya estoy temblando! =) r tee hee… tee hee ...

  2. James James Has the following to say... Tiene las siguientes decir ...

    Great info! Gran info! I thought scrapers and sploggers were just one of the things you had to put up with, like the weather. Pensé sploggers y raspadores son sólo una de las cosas que había a que ponga para arriba con, al igual que las condiciones meteorológicas. I didn’t realise .htaccess was so useful, and the plagiarismtoday.com link is a ripper. Yo no darse cuenta. Htaccess es tan útil, y la vinculación plagiarismtoday.com es un destripador.

    thanks! gracias! =)]
    Jamess last blog post..1 Jamess último blog .. 1

  3. admin admin Has the following to say... Tiene las siguientes decir ...

    @Layne - glad to help once again! @ Layne - encantados de ayudarle una vez más! =
    @James - giving you great resources is what I’m all about… @ James - lo que le de recursos es lo que yo estoy todo sobre ... =)]

  4. putik! putik! Has the following to say... Tiene las siguientes decir ...

    nice article.. bueno el artículo .. will try this one Intentaremos este un

Question or Comment?? Pregunta o comentario? Spill it Now... Derrame Ahora ...

Saltos de alegría en los comentarios!

We Reward Comments! Nos recompensa comentarios!


We dofollow links, and get your latest blog post as a byline under every new comment from the "CommentLuv" plugin! Estamos dofollow enlaces, y obtener su última entrada en el blog como un byline el marco de cada nuevo comentario de la "CommentLuv" plugin! Top commenters for every month are listed on every page of this site in a sidebar widget linked back to your URL! Comienzo de la página comentaristas para cada mes se muestran en cada página de este sitio web en un widget lateral vinculado de nuevo a su URL! We would like to reward you for becoming part of our community! Nos gustaría recompensar a usted para ser parte de nuestra comunidad! Your comment is valuable not only to us, but also all the other readers of this blog! Su comentario es valioso no sólo para nosotros, sino también todos los demás lectores de este blog!


Click to add smilies to your post! Haz clic para añadir emoticones a su puesto! == []^ = (= ((= (|=) r= | 8= 0=) ~= 00= (=;;=)]=;;;