Posts with tag Google

Sémantický web v podání Googlu

Feb|19 2011

Budoucnost internetu se v blízké době bude s velkou pravděpodobností točit kolem sémantického webu. Pojďme se podívat na technologie nabízené Googlem, který bude bezesporu i v dalších letech jedním z leadrů nejen v této oblasti.

Základním problémem sémantického webu je problém značkování. Klasické HTML i XHTML, z nichž druhý jmenovaný se pro automatické zpracování hodí lépe kvůli striktnímu XML formátu, se sémantickým popisem dat nepočítaly. Na druhou stranu nelze z ničeho nic začít používat jiné formáty pro prezentaci dat (např. RDF).

Jedním konkrétním případem, kde se sémantický web začíná uplatňovat v praxi už dnes, jsou stránky on-line obchodů, tedy nabídka zboží. Pokud dnes přijde robot na stránku s popisem zboží, jen velmi obtížně najde relevantní informace, které by mohly být spolehlivé natolik, aby je mohl smysluplně využít. V praxi se proto od portálů žádá speciální rozhraní (většinou ve vormátu XML), kde je možno zjistit přesné informace o produktu.

Nevýhodou speciálních XML feedů je, že každý obchod si tvar XML dokumentu určuje sám, tzn. portláy musí mít tento výpis produktů v mnoha verzích, což je s přibývajícími agregátory stále pracnější. Ideální by bylo, kdyby každý parser uměl vytáhnout všechna data přímo ze stránky, která slouží primárně uživatelům. A k tomu nám idálně poslouží právě sémantický web.

Google pro službu Product Search vyvinul definice jednotlivých metadat, jako je název produktu, kategorie nebo popis. Metadata jsou rozdělena na informace o produktu, o nabídce (cena, prodejce, stav zboží) a o souhrnné nabídce (pokud produkt obsahuje několik variant). Co s těmito údaji Google udělá, je jasné. Co není jasné, jak jednotlivé části webu (tedy HMTL elementy) správně označit dannými metadaty.

Konkrétně Google nabízí hned několik možností. První možností je využít microdata, které jsou součástí HTML 5 a elementům přidají nové atributy itemscope, itemtype a itemprop.

Další možností jsou microformáty, které pro klasifikaci dat používají standardního atributu class, primárně sloužícího pro formátování pomocí CSS. Poslední možností je použití RDFa, tedy rozšíření HTML pomocí jmenných prostorů.  Všechny jsou k vidění na následující ukázce:

<!-- microdata -->
<div itemscope itemtype="http://data-vocabulary.org/Person">
Jmenuji se
<span itemprop="name">Bob Smith</span>
a moje stránky jsou na
<a href="http://www.example.com" itemprop="url">www.example.com</a>.
</div>

<!-- microformat -->
<div class="vcard">
Jmenuji se
<strong class="fn">Bob Smith</strong>
a moje stránky jsou na
<a href="http://www.example.com" class="url">www.example.com</a>.
</div>

<!-- RDFa -->
<div xmlns:v="http://rdf.data-vocabulary.org/#" typeof="v:Person">
Jmenuji se
<span property="v:name">Bob Smith</span>
a moje stránky jsou na
<a href="http://www.example.com" rel="v:url">www.example.com</a>.
</div>

Nyní tedy máme techniky, jak dát robotům možnost získat správná data bez nutnosti definovat XML feed. V českých končinách sice zatím služba nasazena není, ale není špatné vidět do budoucnosti. Z Německa, kde již sémantickým značkám Google rozumí, totiž není daleko.

Tags: Internet | Programování | Google | Facebook | Vývoj



Služby OpenID a MojeID - jak to vlastně zjednodušeně funguje

Oct|27 2010

Pojem OpenID může sice být pro mnoho lidí známý, nicméně pravděpodobně budou vědět pouze to, že se jedná o jakýsi způsob přihlašování pod jednotným heslem. Rozhodl jsme se proto v krátkosti a zjednodušeně technologii OpenID vysvětlit.

Začnu trochu netradičně tím, čím OpenID není. Není to služba nebo jeden konkrétní server, který nabízí registraci a který by potom poskytoval informace jiným serverům. Není to ani žádná vizitka, která by byla pod heslem k dispozici.

Jedná se totiž o protokol, tedy specifikaci určitých pravidel. O tom, jak jsou tato pravidla naplňována, se již starají konkrétní služby na konkrétních serverech. Můžeme tedy mluvit o tom, že se jedná o decentralizovaný model, tedy žádný ze serverů nebo žádná ze služeb není primární, všechny poskytovatelé OpenID technologie jsou si rovny.

Nyní malá ukázka, jak to funguje v praxi. V modelu existují tři základní subjekty:

  1. uživatel, který se chce přihlašovat pokud možno na všech stránkách pomocí stejného jména a hesla
  2. provider - server, který uchovává informace o uživatelově účtu (např. Google, Seznam, nyní nově i MojeID)
  3. webová aplikace, která pro zjištění identity uživatelů používá technologii OpenID

Open ID logoUživatel se nejprve musí zaregistrovat u jednoho z providerů - což je již většinou splněno, protože většina uživatelů má již nějaký účet na jednom z mnoha známých serverů. Pokud potom takový uživatel přijde na webovou stránku, která využívá OpenID, uvidí ikonku pro přihlášení pomocí této technologie.

Server požádá daného providera o sdílené tajemství, které je důležité pro zajištění bezpečnosti při práci s osobními údaji. Uživatel posléze zadá přihlašovací údaje, a to pouze providerovi, tedy webová aplikace se k přihlašovacím údajům nikdy nedostane. Provider buďto potvrdí nebo odmítne a případně předá webové aplikaci další informace (kontaktní údaje, telefon apod.) o uživateli, pokud je potřeba. Celá komunikace je velmi zjednodušeně znázorněna na následujícím obrázku.

Schéma komunikace pomocí technologie OpenID (zjednodušeně)

Za zmínku určitě stojí i způsob autentizace u různých providerů. Nejvíce je rozšířená autentizace pomocí uživatelského jména (ze kterého se vytváří OpenID URL, tedy jednoznačná identifikace uživatele a providera) a hesla. Mezi takové patří např. zmíněný Google, MySpace, Seznam apod.

Některé služby ale poskytují i vyšší způsoby zabezpečení, například pomocí certifikátu, odeslání SMS apod. Takový provider (anglicky nazýván jako strong authentication provider) může být využit i pro aplikace využívající vyšší zabezpečení, například internetové bankovnictví. Mezi takové se chce nyní zařadit i služba MojeID, kterou právě spouští organizace CZ.NIC (zodpovědná za správu českých domén).

Služba MojeID je oproti ostatním trochu zvláštní v tom, že podporuje pouze ověřené kontakty a že spojuje účet pro autentizaci podle protokolu OpenID spolu s účtem vedeným u českých domén. Více o ní se dozvíte v článku na Lupě.

Technologie tedy existuje, o její bezpečnosti zatím nepanují žádné zásadní pochybnosti, provideři postupně přibývají, jen vlastníci stránek a webových služeb trochu zaostávají. Neznám mnoho služeb, které by poskytovali komfort autentizace pomocí OpenID, přestože o jejich výhodách asi nemohou být spory.

Tags: Internet | Programování | Počítače | Bezpečnost | Google | Facebook



Přechytračit Google je čím dál obtížnější

Apr|21 2010

Jak Google ohodnocuje kvalitní zpětné odkazy a má dneska ještě cenu investovat do hledání "partnerů" pro takovou výměnu?

Google má nejen výborné hardwarové technologie, ale i softwarové vybavení je stále čím dál více chatřejší. Představovat si robota Googlu jako stroj, který slepě indexuje celý web, je čirý nesmysl. Google se naopak snaží analyzovat kvalitu textu, celých stránek i jednotlivých odkazů, aby mohl uživatelům nabízet pouze kvalitní zdroje informací. Zda se mu to daří, ponechme nyní stranou. Spíše bych se zaměřil na ohodnocování stránek a zejména těch proklatých zpětných odkazů.

K napsání tohoto článku mě donutilo zjištění, že Google mi pomocí dotazu link:wild-web.eu (link: zobrazí všechny indexované stránky, které odkazují na tuto url) vrátil pouze dva odkazy, zatímco osobně vím o desítkách. Ty se vyskytují zejména v postranních nebo dolních lištách, případně pak na stránce speciálně určené pro výměnu odkazů.

Nezastírám, že odkazy jsem si s těmito weby vyměnil záměrně a to z důvodu zvýšení počtu zpětných odkazů. Co na to Google? Jednoduše tyto odkazy ignoruje, protože je nepovažuje za kvalitní. Asi také kvalitní nejsou. Je zkrátka příliš chytrý.

Jak ho tedy přesvědčit, že vaše stránky obsahují kvalitní informace, neboť odkazy na ně směřující jsou kvalitní? Například tím, že bude váš odkaz uprostřed článku, daleko od ostatních podobných odkazů. Může tam být i vícekrát v různých obměnách, například na konkrétní podstránky vašeho webu.

A ještě lepší bude, když se i v okolním textu budou vyskytovat podobná klíčová slova, jako na vašich stránkách, zkrátka pokud bude celý článek vychvalovat vaše stránky. A pokud se takových článků (tedy kvalitních zpětných odkazů) na internetu válí hodně, znamená to jediné: vaše stránky jsou kvalitní. Má to dobře vymyšlené, ten Google.

Ponaučení: Je potřeba si uvědomit, že časy tisíců zpětných odkazů z patiček nebo hromadných "partnerských" podstránek jsou tytam, dnes se nepočítá kvantita, ale kvalita. Raději investujte úsilí k vytvoření pár kvalitních odkazů než stovek obyčejných, nekvalitních. Vyplatí se vám to.

Tags: Internet | Programování | Google



Mar|30 2010

Osobní stránky - jednoduše V denšní době existuje mnoho způsobů, jak si vytvořit své osobní stránky. Pominu způsob vlastní tvorby (programování HTML stránek, případně PHP) a nabídnu Vám několik způsobů, jak i zadarmo a bez znalosti programování vytvořit své stránky. Nejdříve je potřeba si rozmyslet, co chci na svých osobních stránkách prezentovat. Samoúčelné stránky (podle hesla "hlavně abych nějaké měl") jsou k ničemu, takže pokud na svých stránkách nechcete prezentovat nic smysluplného, co by ostatní mohlo alespoň trochu zajímat, raději se od tvorby ani nepouštějte. Vždy je dobré mít na paměti, pro koho stránky připravuji a co chci návštěvníkům sdělit. Toto bychom měli mít vždy na mysli. Pojďme tedy už konkrétně k samotné tvorbě. Internet je dnes plný zajímavých nástrojů a aplikací, které Vám dovolí "naklikat" si Vaše vlastní stránky doslova za pár sekund. Vesměs to probíhá velmi podobně, je nutné se zaregistrovat (vyplnit nacionále, kontakt a nějaké bližší informace), potvrdit podmínky registrace a pak již můžete směle tvořit. Vyberete si z několika nabízených témat (návrhy stránek) a potom na vybraná místa dopíšete své texty. To stačí k tomu, abyste byli součástí WWW. Záleží na charakteru a rozsáhlosti systému, co vše dovolí změnit. Zde je na ukázku několik systémů, které nabízejí zmíněné služby: Webgarden http://zone.webgarden.cz/ Rodinné weby http://www.rodinneweby.cz/ Někomu může stačit obyčejný blog (pokud nevíte, co je to blog, dozvíte se více zde), ten si můžete zřídit na http://www.bloger.cz/ http://www.bloguje.cz/

Tags: Internet | PHP | Programování | Google | Facebook



Budoucnost vyhledávačů a SEO/SEM

Mar|24 2010

Na co se zaměřit, aby se vaše aktivity spojené se SEO/SEM setkaly s úspěchem i v budoucnu?

Pojďme se nejdříve podívat trochu do minulosti. Před deseti, patnácti lety nebylo těžké na svou stránku nalákat dostatek uživatelů - registrace do katalogu, zajímavý popisek v META informacích o stránce, trocha reklamy a bylo vystaráno. Uživatelé při snaze najít hledaný obsah procházeli katalogy stránek a chtě-nechtě museli věřit popiskům u jednotlivých položek.

GoogleByla to prachsprostá otročina, která ale šla celkem dobře zautomatizovat a začaly vznikat inteligentní fulltextové vyhledávače. Ty, aby daly uživatelům obsah, který požaduje, začaly obsah stránek analyzovat a nabízet kvalitní a relevantní stránky před těmi ostatními.

A podle zákonu akce a reakce vzniklo nové odvětví marketingu, které se snaží vyhledávače přesvědčit, že právě jejich stránky jsou ty kvalitnější a relevantnější k danému tématu, než ty ostatní - vzniklo SEO/SEM.

Nyní vyhledávač hledí zejména na strukturu a validitu dokumentu, počet a kvalitu zpětných odkazů, a stále více také na obsah. Validita a správná struktura kódu, důležitá například pro automatické zpracování stránek, jak doufám, se za pár let stane standardem, pojďme se tedy podívat na ty ostatní.

Řekňeme, že máme obsah, který je kvalitní a relevantní k zadané frázi. Toho si všimnou blogeři a tweateři, kterých stále přibývá, a do svých příspěvků umístí odkaz. Co tím získáme? Velmi kvalitní a upřímný odkaz. Pokud bude článek hodně kvalitní, tak dokonce mnoho takových odkazů.

A co nás čeká v budoucnu z pohledu vyhledávačů? Zajisté ještě chytřejší vyhledávače. Nejen že nám bude Google nabízet stále více profilované výsledky podle našich zájmů, ale bude umět lépe rozpoznat kvalitní a upřímě myšlený odkaz, od odkazu vytvořeného pouze za účelem bezhlavého linkbuildingu. Také bude umět rozpoznat kvalitní obsah od nekvalitního. Jak? Nechme se překvapit.

Podtrženo, sečteno, pokud dnes chceme správně investovat, abychom z toho měli zisk i v budoucnu, jediné, co se mi zdá bezesporu lukrativní, je obsah. Jedině ten z vašich stránek nezmizí, nepřestane být méně kvalitní, a jedině ten uživatel hledá. A kdo hledá, ten najde.

Tags: Internet | Programování | Počítače | Google



Google wave - o co jde?

Jan|19 2010

Google Wave (http://wave.google.com) je nová aplikace, která má být alternativou a zároveň kombinací emailu, instant messagingu a sociálních sítí. Do testování tzv. Preview verze se může zapojit každý, kdo dostane pozvánku od člověka, který ho již testuje.

Úvodní videa rychle představí, jak se s tímto nástrojem pracuje, nicméně některé věci nejsou úplně intuitivní. Například návod na změnu avataru jsem musel vygooglit, ať jsem klikal, na co jsem chtěl, nemohl jsem tuto volbu najít. Ale je tam ;)

Google WaveV základu bych aplikaci přirovnal k Facebooku bez aplikací - tedy bavit se v různých skupinách lidí o různých tématech, jednotlivá vlákna uchovávat atd. I v Google Wave budou ale postupně přibývat tzv. rozšíření (Extensions) a já se jen bojím, aby si Wave zachoval jednoduchost, kterou mě hned zpočátku mile překvapil.

Nejvíce mě ale zarazilo jedno: Absolutně nechápu, proč se text právě psané zprávy sdílí s účastníky konverzace v reálném čase (tedy je vidět každý hloupý překlep) a ne až po potvrzení. Co se mě týká, některé delší příspěvky dokáži totiž formulovat tak zdlouhavě, že se na druhé straně ukoušou nudou, než se můj výtvor dočká finální podoby.

Jinak musím Googlu vzdát holt, že se i v době Facebooku snaží přijít s něčím novým a neokoukaným, ostatně to on dělá docela často. Osobně ve "vlnách" vidím velký potenciál.

Tak co, chcete pozvánku?

Tags: Internet | Prohlížeče | Počítače | Google