Google Code Search
Google bietet schon einige Zeit die Suche in frei zugänglichen Quelltexten an. Eines der Kriterien ist die Lizenz - damit ist die Zielgruppe kar: Entwickler die Hife suchen, und das Rad nicht immer neu erfinden wollen. Zu den Hintergründen interviewed auch David Berlind (ZDNet) den Google Product Manager Tom Stocky.
Google CodeSearch geht allerdings über die üblichen Volltext und Metadaten suchen hinaus. CodeSearch erlaubt mit Reguar Expression die Formuierung von Such-Ausdrücken die komplexe Beziehungen abprüfen. Dieses ermöglicht Data Mining in Unmengen von Quellcode, sehr praktisch für Untersuchungen zu Patterns oder Bug-Patterns.
Mein Kollege Ulli (der hier eigentlich mal Gast-Bloggen könnte!) hat mich auf ein Projekt hingewiesen, das genau dieses versucht: häufige Fehler-Konstrukte in CodeSearch Regeln formulieren, und dann auf alle frei verfügbaren Quellen loslassen: Bugle - Google Source Code Bug Finder
Da bekommt man Lust dieses mit dem eigenen Code zu tun. Aber wer diesen nicht offenlegen will muss wohl vorerst mit Alternativen Vorlieb nehmen (die gängigen Code Inspection und Style Checker Tools haben auch Regeln in denen man den Quellcode durchsuchen kann).
Hier auch ein Beispiel: einige meiner Open Source Beiträge. Wie man sehen kann sind einige Duplikate dabei...
Comments
Display comments as Linear | Threaded