sessionid abschalten bei googlebesuch?

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • sessionid abschalten bei googlebesuch?

    Hallo leute,

    ich suche ein codeschnipsel womit sich die Sessionid abschalten läßt wenn google mich besucht.

    so eine art googlebot = nosid

    hab schon die Suche befragt mit:

    "session + google"
    "session abschalten"
    "session + suchmaschinenfreundlich"
    "session killen"

    aber das was ich suche war da leider noch nicht bei.
    mfg
    marc75

    <Platz für anderes>

  • #2
    PHP-Code:
    // wenn Google
    if(preg_match("#Googlebot#i"getenv("HTTP_USER_AGENT"))){
        
    // SessionID abschalten
        
    @ini_set("url_rewriter.tags""");

    TBT

    Die zwei wichtigsten Regeln für eine berufliche Karriere:
    1. Verrate niemals alles was du weißt!


    PHP 2 AllPatrizier II Browsergame

    Kommentar


    • #3
      oder du startest die session nur dann, wenn du nicht von google besucht wirst
      Ich denke, also bin ich. - Einige sind trotzdem...

      Kommentar


      • #4
        Original geschrieben von mrhappiness
        oder du startest die session nur dann, wenn du nicht von google besucht wirst
        mhh und wie?

        momentan starte ich die ja mit:

        session_start()

        oben in den betreffenden Dateien.
        mfg
        marc75

        <Platz für anderes>

        Kommentar


        • #5
          einfach kombinieren:

          PHP-Code:
          if(!preg_match("#Googlebot#i"getenv("HTTP_USER_AGENT")))
             
          session_start(); 

          Kommentar


          • #6
            Original geschrieben von TobiaZ
            einfach kombinieren:

            PHP-Code:
            if(!preg_match("#Googlebot#i"getenv("HTTP_USER_AGENT")))
               
            session_start(); 
            funktioniert super, hab es mal mit dem lynxviewer probiert.

            läßt sich die suma angabe erweitern in form von:

            "fast-webcrawler",
            "ferret",
            "googlebot",
            "gulliver",

            oder so:

            PHP-Code:
            if(!preg_match("#Googlebot#i""#fast-webcrawler#i"getenv("HTTP_USER_AGENT"))) 
            mfg
            marc75

            <Platz für anderes>

            Kommentar


            • #7
              PHP-Code:
              if(!preg_match("#Googlebot#i"getenv("HTTP_USER_AGENT")) ||
              !
              preg_match("#fast-webcrawler#i"getenv("HTTP_USER_AGENT")) ||
              !
              preg_match("#ferret#i"getenv("HTTP_USER_AGENT")) ||
              !
              preg_match("#gulliver#i"getenv("HTTP_USER_AGENT"))) 
              *winks*
              Gilbert
              ------------------------------------------------
              Hilfe für eine Vielzahl von Problemen!!!
              http://www.1st-rootserver.de/

              Kommentar


              • #8
                wunderbar..

                str_replace verträgt ja auch Arrays, das ist bei preg aber nicht dre fall. vielleicht indest du noch was in der richtung?

                Kommentar


                • #9
                  Original geschrieben von marc75
                  funktioniert super, hab es mal mit dem lynxviewer probiert.

                  läßt sich die suma angabe erweitern in form von:

                  "fast-webcrawler",
                  "ferret",
                  "googlebot",
                  "gulliver",

                  oder so:

                  PHP-Code:
                  if(!preg_match("#Googlebot#i""#fast-webcrawler#i"getenv("HTTP_USER_AGENT"))) 
                  dann solltest du richtig erweitern
                  PHP-Code:
                  // Suchmaschinen bzw. unbekannt
                      
                  "almaden",                     // Suchmaschine www.almaden.ibm.com
                      
                  "appie",                     // Suchmaschine www.walhello.com
                      
                  "bumblebee",                 // Suchmaschine www.relevare.com
                      
                  "WebCrawler",                 // Suchmaschine www.webcrawler.com
                      
                  "Fluffy the spider",         // Suchmaschine www.searchhippo.com
                      
                  "Firefly",                     // 
                      
                  "Flickbot",                 // 
                      
                  "cosmos",                     // www.xyleme.com
                      
                  "BaiDuSpider",                 // 
                      
                  "GAIS Robot",                 // Suchmaschine: seednet
                      
                  "Gigabot",                     // 
                      
                  "Girafabot",                 // Suchmaschine www.girafa.com
                      
                  "SlySearch",
                      
                  "backrub",                    // google
                      
                  "Googlebot",                 // Suchmaschine www.google.de
                      
                  "grub-client",                 // www.grup.org
                      
                  "Gulper",                     // Suchmaschine www.ecsl.cs.sunysb.edu/~maxim/cgi-bin/Link/GulperBot (research prototyp)
                      
                  "hitwise",                     // www.hitwise.com
                      
                  "htdig",                     // 
                      
                  "ia_archiver",                 // 
                      
                  "Indy Library",             // 
                      
                  "slurp@inktomi",             // www.inktomi.com
                      
                  "larbin",                     // unspecific bot
                      
                  "Lycos",                     // Suchmaschine www.lycos.com
                      
                  "Acoon" ,                     // Suchmaschine Acoon
                      
                  "@messebasel",                 // Suchmaschine Messe Basel
                      
                  "@bluewin" ,                 // Suchmaschine sear.ch
                      
                  "@pta" ,                     // Suchmaschine search.at
                      
                  "@altavista.de" ,             // Suchmaschine AltaVista Deutschland
                      
                  "anzwerscrawl" ,             // Suchmaschine Anzwers
                      
                  "arachnoidea" ,                 // Suchmaschine EuroSeek
                      
                  "architext" ,                 // Suchmaschine Excite
                      
                  "fido/" ,                     // Suchmaschine PlanetSearch
                      
                  "gais robot" ,                 // 
                      
                  "gulliver" ,                 // Suchmaschine Northern Light
                      
                  "infoseek" ,                // Suchmaschine Infoseek
                      
                  "fireball" ,                // Suchmaschine Fireball
                      
                  "lwp-trivial",                 // Suchmaschine Search 4 Free
                      
                  "lycos_spider",             // Suchmaschine Lycos
                      
                  "ezresult" ,                // Suchmaschine EZResult
                      
                  "T-H-U-N-D-E-R-S-T-O-N-E" ,    // Suchmaschine Thunderstone
                      
                  "MuscatFerret",             // Suchmaschine EuroFerret
                      
                  "kolibri" ,                    // Suchmaschine Kolibri Online
                      
                  "Scooter" ,                    // Suchmaschine AltaVista
                      
                  "Search.at" ,                // Suchmaschine search.at
                      
                  "************searcher",                 // Suchmaschine ************searcher
                      
                  "Slurp" ,                    // Suchmaschine Hotbot
                      
                  "SwissSearch",                 // Suchmaschine SwissSearch
                      
                  "The Informant",             // Suchmaschine The Informant
                      
                  "Ultraseek" ,                // Suchmaschine Ultraseek
                      
                  "WiseWire" ,                // Suchmaschine WiseWire"
                      
                  "MSIECrawler",                //
                      
                  "Mercator",                    //
                      
                  "metacarta",                // www.metacarta.com
                      
                  "NationalDirectory",        //
                      
                  "NetResearchServer",        // www.loopimprovements.com
                      
                  "NutchCrawler",                // 
                      
                  "obot",                        // 
                      
                  "Openbot",                    // www.openfind.com.tw
                      
                  "polybot",                    // http://cis.poly.edu
                      
                  "Pompos",                    // http://pompos.iliad.fr
                      
                  "psbot",                    // Suchmaschine www.picsearch.com
                      
                  "reifier",                    // 
                      
                  "Scrubby",                    // www.scrubtheweb.com
                      
                  "SlySearch",                // www.slysearch.com
                      
                  "internetseer",                // http://sitecheck.internetseer.com
                      
                  "TurnitinBot",                // www.turnitin.com
                      
                  "UIowa",                    // 
                      
                  "VoilaBot",                    //
                      
                  "vspider",                    // 
                      
                  "WebSearch",                // Suchmaschine www.websearch.com.au
                      
                  "WebWombat",                // www.webwombat.com.au
                      
                  "Wget",                        //
                      
                  "Webster",                    //
                      
                  "ZyBorg",                    // www.WISEnutbot.com
                      
                  "rabaz",                      //  rabaz (rabaz at gigabaz dot com)
                       
                  "MFC",                         // MFC Foundation Class Library 4.0
                      
                  "TECOMAC-Crawler/0.3",
                      
                      
                  // definitive Email Sammler 
                      
                  "CherryPicker",             // CherryPicker
                      
                  "Crescent",                 // ExtractrorPro / WebWeasel / Web Mole
                      
                  "EmailCollector",             // EmailCollector www.saurabhinformatics.com/emailcollector/
                      
                  "EmailSiphon",                 // EmailSiphon
                      
                  "EmailWolf",                 // emailWolf
                      
                  "ExtractorPro",             // ExtractorPro www.lencom.com/FEE.html
                      
                  "Mozilla/2.0 (compatible; NEWT ActiveX; Win32)"// WebCollector
                      
                  "WEBMOLE",                     // Web Mole
                      
                  "Microsoft URL Control",     // 
                      
                  "NICErsPRO",                 // 
                      
                  "Telesoft",                 // Telesoft
                      
                  "WebBandit",                 // WebBandit
                      
                  "WebEMailExtractor",         // WebEMailExtractor
                      
                  "Advanced Email Extractor",    // Organica 2.24
                      
                  "Mail Sweeper",                //
                   
                      // HTML-Code Validatoren
                      
                  "Java1.1.3",
                      
                  "KGValidator",
                      
                  "LECodeChecker",
                      
                  "libwww-perl/5",
                      
                  "Mozilla/3.0 Gold",
                      
                  "ValueClick Robocop",
                      
                  "W3C_Validator",
                      
                  "0.5 libwww-perl/0"
                  TBT

                  Die zwei wichtigsten Regeln für eine berufliche Karriere:
                  1. Verrate niemals alles was du weißt!


                  PHP 2 AllPatrizier II Browsergame

                  Kommentar


                  • #10
                    SAUBER TBT!

                    Ich verschieb mal nach PHP!

                    Kommentar


                    • #11
                      @TBT so eine Liste hab ich hier auch vorliegen (für einem phpbb), hatte die vier nur als beispiel genommen gehabt. Werde nachher (wenn ich zeit finde) mal vergleichen ob ich auch die alle habe.


                      hab hier noch eine Funktion gefunden, könnte die auch funktionieren?

                      PHP-Code:
                      function areyouabot(){
                      global 
                      $HTTP_SERVER_VARS;

                          
                      $RobotsList = array (
                          
                      "antibot",
                          
                      "lynx",
                          
                      "appie",
                           
                      "---   gekürzt ----",
                          
                      "nzexplorer",
                          
                      "spiderview",
                          
                      "crawl"
                          
                      );

                          
                      $botID strtolower($HTTP_SERVER_VARS['HTTP_USER_AGENT']);

                          for (
                      $i 0$i count($RobotsList); $i++) 
                          {
                              if ( 
                      strstr($botID$RobotsList[$i]) )
                              {
                                  return 
                      TRUE;
                              }
                          }
                          return 
                      FALSE;
                          
                      }  
                      session_start(); 
                      man könnte es auch eventl. vor session_start includen, wenn session_start damit klar kommt.
                      mfg
                      marc75

                      <Platz für anderes>

                      Kommentar


                      • #12
                        hallo,

                        wie es geht habe ich verstanden. mir fehlt aber der hintergrund: warum?

                        vermutung: sessions halten die suchmaschinen ab, tiefer einzusteigen?

                        welche beziehung besteht zum thread "suchmaschinenfreundlich programmieren", ergänzend? konkurrierend (wohl eher nicht)?

                        danke für aufklärung
                        gruss oskar40

                        kapieren - nicht kopieren

                        Kommentar


                        • #13
                          welche beziehung besteht zum thread "suchmaschinenfreundlich programmieren", ergänzend? konkurrierend (wohl eher nicht)?
                          eher ergänzend, wenn du die sessionübergabe per url, auch mit anbietest.

                          und ja sumas mögen sids nicht und wenn du die sid einfach per modrewrite in die links einbettest.

                          z.B. datei-sid-sfdg6541383387-irgendwas.htm

                          Kann es passieren das sich die Sumas bei dir festfressen und massig Traffic produzieren oder sogar lahmlegen. Weil sobalt sich die Sid ändert denkt die suma ja es ist eine neue Datei. Und die Sid wird ja nun mal bei jedem Besuch neu gestartet.
                          mfg
                          marc75

                          <Platz für anderes>

                          Kommentar


                          • #14
                            so funzt es, sicherlich nicht Top, aber es geht:


                            PHP-Code:
                            if(!preg_match("#Googlebot#i"getenv("HTTP_USER_AGENT")) && !preg_match("#lynx#i"getenv("HTTP_USER_AGENT")))
                               
                            session_start(); 

                            PHP-Code:
                             && !preg_match("#lynx#i"getenv("HTTP_USER_AGENT")) 

                            das müsste dann für jede Suma wiederholt werden, und "lynx" muss dann halt noch angepasst werden.
                            mfg
                            marc75

                            <Platz für anderes>

                            Kommentar


                            • #15
                              hallo Leute,

                              ich bräuchte da mal noch mal Hilfe

                              hab mir hier folgendes aus einem anderem Forum zusammengebastelt, nur funktionieren tut es nicht. Kann mir vielleicht einer sagen wo mein gedankenfehler ist.

                              PHP-Code:
                               <?
                              $sumas = array (
                                  "#antibot#i",
                                  "#appie#i",
                                  "#architext#i",
                                  "#´---gekürzt----#i",
                                  "#webcompass#i",
                                  "#yandex#i",
                                  "#robot#i",
                                  "#lynx#i",
                                  "#crawl#i",
                                  );
                              if(!preg_match("$sumas", getenv("HTTP_USER_AGENT")))
                              session_start();
                              ?>
                              oder sollte das garnicht funktionieren können was ich mir da zusammengesucht habe?

                              Eventl. kann mir jemand folgenden code umschreiben so das er session_start nur ausführt wenns keine suma ist:
                              PHP-Code:
                               function areyouabot(){
                              global 
                              $HTTP_SERVER_VARS;

                                  
                              $RobotsList = array (
                                  
                              "antibot",
                                  
                              "lynx",
                                  
                              "---gekürzt---",
                                  
                              "yandex",
                                  
                              "robot",
                                  
                              "crawl"
                                  
                              );

                                  
                              $botID strtolower($HTTP_SERVER_VARS['HTTP_USER_AGENT']);

                                  for (
                              $i 0$i count($RobotsList); $i++) 
                                  {
                                      if ( 
                              strstr($botID$RobotsList[$i]) )
                                      {
                                          return 
                              TRUE;
                                      }
                                  }
                                  return 
                              FALSE;
                                  

                              Der untere code selbst stammt aus einer session.php von einem phpbb.
                              mfg
                              marc75

                              <Platz für anderes>

                              Kommentar

                              Lädt...
                              X