Web Marketing Forum: il      

Web Marketing University     Regolamento     

Torna Indietro   Web Marketing Forum: il "SUCCO" del WebMarketing > Lead Generation ed Acquisizione Clienti > SEO - Ottimizzazione e Posizionamento sui Motori di Ricerca
Registrazione FAQ Lista Utenti Calendario Segna Forums Come Letti Tags

RispondiScrivi Nuova Discussione
 
LinkBack Strumenti Discussione Modalità Visualizzazione
Vecchio 27-01-2012, 10:49   #1 (permalink)
Alan.Curtis
Alan Curtis
Junior Member
 
L'avatar di Alan.Curtis
 
Data Registrazione: Jan 2012
Località: Tirana, Albania
Messaggi: 4
Thanks: 4
Thanked 3 Times in 1 Post

Profilo Twitter: http://twitter.com/advertalis
Predefinito Software per ricerca e analisi duplicati interni a un sito


Ciao a tutti!

Ieri, dovendo fare un'analisi su un sito abbastanza grande di un cliente (circa 5.000 pagine) mi sono ritrovato gli stessi contenuti (o molto molto simili) disposti in pagine e sezioni diverse, dove a cambiare era solo il menu e poco altro.

Il livello di similitudine è molto alto, ma andarle a scovare a mano è proibitivo.

Ho fatto una ricerca online, ma ho trovato solo soft che fanno spidering e poi confrontano titles, hash, size o altri elementi "esterni", trovando solo i duplicati ESATTI.

A me invece interessa un soft che mi faccia il confronto di similitudine tra tutte le pag. di un sito, segnalandomi quelle che superano una certa soglia di uguaglianza. E comparando SOLO il testo visibile, ovviamente, non tags html.

Esiste un software così? lo conoscete?

Aspetto i vostri consigli e suggerimenti!
Voglio stanare i maledetti duplicati che affliggono i miei siti, please!



Alan.Curtis è offline   Rispondi Citando
Sponsor post

Ecco i “15” motivi per cui il Tuo Marketing su Facebook NON dà risultati …
Clicca e scarica il PDF di 30 Pag già scaricato da gran parte dei Fan:

Rispondi
Tags: ,



Strumenti Discussione
Modalità Visualizzazione

Regole di Scrittura
Tu non puoi inviare nuove discussioni
Tu non puoi replicare
Tu non puoi inviare allegati
Tu non puoi modificare i tuoi messaggi

Il codice BB è Attivato
Le faccine sono Attivato
Il codice [IMG] è Attivato
Il codice HTML è Attivato
Trackbacks are Attivato
Pingbacks are Attivato
Refbacks are Attivato



Tutti gli orari sono GMT +2. Adesso sono le 00:47.


Traduzione italiana : www.vbulletin.it Hosting By: Serverplan
© 2008-2010 WebFactory S.r.l P.iva 02601290733 - Privacy/Disclaimer
Da un'idea di: Alessandro Sportelli
Logo Realizzato da: Luciana Lato - info@lldesigns.it

Search Engine Friendly URLs by vBSEO 3.6.0