Dubbele content/subdirectory/linkfarm

Karel

Nieuw lid
21 feb 2008
814
1
0
#1
Hoi,

Ben momenteel erg met Panda bezig.

Wellicht weet jij antwoord op.

1 Dubbele content aanduiding hoofddomein

Het hoofddomein kan bereikt worden via http://www.mijnsite.nl/ en via http://www.mijnsite.nl/index.html en via http://mijnsite.nl/ en http://mijnsite.nl/ndex.html
kortom 4x. En Google ziet ze allemaal als verschillende websites en dus ziet ie 4x dezelfde content. Hoe los je dit op? Via .htaccess ? En hoe dan??

2 Subdirectories beginnen ook met index.html

Mijn directory structuur is als volgt. Hoofddirectory begint met index.html. Een subdirectory is http://www.mijnsite.nl/subdirectory/ ook deze begin ik met een index.html. Ik redeneer dat als je dat doet, de belangrijkheid van de hoofd index.html toeneemt en dat het vaker voorkomt dat je dubbel wordt vermeld in Google. Je weet wel die dubbele aanduiding. Bovendien kun je die laatste als aparte site in diverse zoekmachines plaaatsen, Google ziet die en ziet ook een hoop dieplinken. Dat werkte prima.

Maar is dat nog zo? Nadeel is namelijk dat er een onduidelijkheid gaat ontstaan. Meerdere index.html's in één website. En dat Google meerdere kleine websites ziet en als kleine website indexeert, in plaats van één grote met alleen de hoofd index. Oplossing zou dan zijn om bijv. http://www.mijnsite.nl/subdirectory/naamsubdirectory.html aan te maken.
Wat is het beste?

3 Linkfarm
Nu is het zo dat ca 30 websites vanaf 1 hostplek vrolijk met elkaar linken.
Dit zou door Google als een linkfarm kunnen worden opgevat. Dit tegenover de
praktische doelmatigheid. Wat is de grens dat Google iets herkent als
linkfarm?

Groetjes
Karel
 

oeroek

Nieuw lid
21 jun 2008
166
0
16
www.saunagespot.nl
#2
1)
in htaccess bijvoorbeeld het volgende.

RewriteCond %{HTTP_HOST} ^mijnsite\.nl$ [NC]
RewriteRule ^(.*)$ http://www.mijnsite.nl/$1 [L,R=301]
op www.mijnsite.nl/index.html en www.mijnsite.nl/ zet je afhankelijk van welke pagina je in de index wilt, tussen <head></head>
<link rel="canonical" href="http://www.mijnsite.nl" />
of
<link rel="canonical" href="http://www.mijnsite.nl/index.html" />
2)
ik ben zelf niet zo'n fan van het gebruik van index.html en verwijs bij voorkeur door naar het voorliggende mapje. dus mijnsite.nl/subdir/index.html wordt bij mij mijnsite.nl/subdir/ dat komt ook prima terecht in de Google index. Als je CMS een index.html pagina maakt dan kun je via de oplossing uit punt 1 (rel="canonical" ) zorgen dat Google 1 van beide in de index opneemt. Je kiest dan zelf welke.
Duplicate content heeft Google niets aan en er is een goede kans dat er maar 1 in de index komt. ALs je vervolgens backlinks krijgt gaat de ene link naar mijnsite.nl en de andere naar mijnsite/nl/index.html . Allemaal niet echt bevordelijk. Daarbij mis je een kans om een keyword toe te voegen in de URL. keyword.html heb je meer aan dan index.html Denk er ook aan dat er mensen zijn die de bestandsnaam uit de URL halen om te kijken wat er in het submapje staat. In mijn ogen zou je dan de homepage van dat mapje te zien moeten krijgen.
3)
waar de grens precies ligt is bedrijfsgeheim van Google. Als je dat zou weten zou iedereen vlak onder de grens gaan zitten. Ik doe het in elk geval niet. Zelfs als Google het accepteert is er een goede kans dat ze de links niet voor vol meetellen.
 

jworks

Nieuw lid
4 jul 2010
25
0
0
www.shoppenbij.nl
#3
oeroek zei:
RewriteCond %{HTTP_HOST} ^mijnsite\.nl$ [NC]
RewriteRule ^(.*)$ http://www.mijnsite.nl/$1 [L,R=301]
1. Naast die regel (om http://mijnsite permanent naar http://www.mijsite door te verwijzen),
om index.html en ndex.html naar / te verwijzen:
Code:
Rewriterule 301 index.html /
Rewriterule 301 ndex.html /
2. Ik sluit me aan bij Oeroek.

3. Ik heb ooit een hele site verpest door slechts 1 link te plaatsen vanaf hetzelfde IP adres. De site waar de link op stond bleef het goed doen, maar de site waar de link naar toe ging werd begraven in de zoekresultaten. Als in jouw geval de links al een tijdje staan en je hebt niets opgemerkt, dan kan je ze gewoon laten staan. Als je je er zorgen over maakt, dan zou ik ze rel="nofollow" attribuut geven.
 

ouwesmurf

Nieuw lid
25 jan 2008
3.028
0
0
wfsidee.nl
#4
1.
Oeroek geeft deze oplossing aan :
RewriteCond %{HTTP_HOST} ^mijnsite\.nl$ [NC]
RewriteRule ^(.*)$ http://www.mijnsite.nl/$1 [L,R=301]
voor de volledigheid, hiermee werk je de www weg,
en aanvullend kun je in Google sitemap hetzelfde nog eens benadrukken, dwz dat je aangeeft dat je de versie zonder www wilt zien in de serps.

en : 'h t t p: // mijnsite.nl/index.html'
de index.html werk je in mijn optiek in de htaccess weg met :
DirectoryIndex index.html
en wordt dan overal : 'h t t p: // mijnsite.nl/ '
moet je in de tekst verwijzen naar die pagina, bijv. met terug naar start (= index.html) , dan wordt dat '/' .
Apache zal altijd het pad zoeken vanaf de root, en door alleen de slash toe te passen, gaat de instructie
directoryindex z'n wegwijzerwerk doen.

de index.html in de subdirectory eigenlijk analoog,
iets simpeler en iets moeilijker :
alle htaccess files worden op een site bij elkaar opgeteld, dus maak je er veel, krijg je een trage soep.
Dus voorkom doublures en plaats in de htaccess van de subdirectory alléén het hoogst noodzakelijke,
Het moeilijke zit 'm er in dat sommige mensen subdirectory door elkaar halen met subdomein.

Maar wanneer je simpel de structuur hanteert van : 'h t t p: // mijnsite.nl/deze/die/ '
en in 'die' staat óók een index.html,
zet je in 'die' een htaccess met DirectoryIndex index.html
en in je verwijzingen '/deze/die/'
immers, gerekend vanaf de root !

Al zou ik de naam index.html inderdaad ook een andere naam geven, anders moet je eerst de file lezen, voordat je weet dat je daarin net nièt moest gaan lezen. Gewoon een begrijpelijke naam geven, voor alles en iedereen beter.
 

Karel

Nieuw lid
21 feb 2008
814
1
0
#5
Bedankt voor de bruikbare reacties.

RewriteEngine On
RewriteCond %{HTTP_HOST} ^mijnsite.nl
RewriteRule (.*) http://www.mijnsite.nl/$1 [R=301,L]

geeft bij dat alles van http://mijnsite.nl/ gezien wordt als http://www.mijnsite.nl/

Precies anders dan jij aangeeft? Wat mis ik?

karel
 

ouwesmurf

Nieuw lid
25 jan 2008
3.028
0
0
wfsidee.nl
#6
Karel zei:
Bedankt voor de bruikbare reacties.

RewriteEngine On
RewriteCond %{HTTP_HOST} ^mijnsite.nl
RewriteRule (.*) http://www.mijnsite.nl/$1 [R=301,L]

geeft bij dat alles van http://mijnsite.nl/ gezien wordt als http://www.mijnsite.nl/

Precies anders dan jij aangeeft? Wat mis ik?
karel
Ieder heeft zo z'n voorkeuren en wegen om iets te bereiken, probeer deze eens die bij mijn sites goed werkt :

RewriteCond %{HTTP_HOST} !^mijnsite.nl$ [NC]
RewriteRule ^(.*)$ http://mijnsite.nl/$1 [L,R=301]

Kijk je naar de eerste regel dan zegt het "dakje" , begin bij het begin, en het uitroepteken de mathematische ontkenning, dus in programmeertaal 'NOT', en in vrije taal : als het dit dus niet is dan ....

maak je er de tweede van. Eerste regel is de conditie, de voorwaarde die opgezocht moet worden, en de tweede regel geeft het wensenpakket aan.

Voor het algemeen belang : dit is een zeer leesbare instructie over mod_rewrite van url's en deze levert bijvoorbeeld een gemakkelijke sheet op in het kort.

Geldt alleen bij Apache gestuurde omgeving.