= PyAmazon = [[PageOutline]] http://www.josephson.org/projects/pyamazon/ v0.65 についてのメモ.仕様が割とひどい. == 基本 == 以下は amazon.co.jp から「のだめ」を検索した結果を適当に出力する例. 検索キーワードには UTF-8 文字列 ('''unicode オブジェクトではない''') を指定してやる必要がある. そのくせ,'''返ってくる値は unicode オブジェクト'''なので注意 (以下の例だと val が相当). {{{ #!python import amazon LOCALE = 'jp' ACCESS_KEY = 'your access key' amazon.setLocale(LOCALE) amazon.setLicense(ACCESS_KEY) data = amazon.searchByBlended(unicode('のだめ', 'euc-jp').encode('utf-8')) for p in data.ProductLine: details = p.ProductInfo.Details # for d in details: for key, val in d.__dict__.iteritems(): print '%(key)s: %(val)s' % locals() }}} == searchByKeyword の罠 == searchByKeyword 関数で,あるカテゴリの中から検索することができる. * しかし,searchByBlended と違って data をそのまま返さずに data.Details を返しやがる (amazon.py の 312 行目を参照) ので,searchByKeyword を使うと,'''!TotalPages や !TotalResults を得ることができない'''. * さらに,searchByKeyword の引数に,デフォルトで product_line="books" というのが入っているが,ロケールを jp にした場合はこれだと正しく検索できない.jp ロケールで有効な product_line は以下の通り (たぶん). ||books-jp||和書|| ||books-us||洋書|| ||music-jp||ポピュラー音楽|| ||classical-jp||クラシック音楽|| ||dvd-jp||DVD|| ||vhs-jp||ビデオ|| ||electronics-jp||エレクトロニクス|| ||kitchen-jp||ホーム&キッチン|| ||software-jp||ソフトウェア|| ||videogames-jp||ゲーム|| ||magazines-jp||雑誌|| ||toys-jp||おもちゃ&ホビー|| ||photo-jp||?|| ||pc-hardware-jp||?|| == searchByBlended の罠 == searchByBlended 関数は amazon に対して全体検索をかけることが可能. searchByKeywords のように,この関数にも引数に page というのがあるが,'''ページ指定はできない'''.何のための引数なのか,かなり謎. もっとも,Blend の場合にページ指定ができないのは Amazon API 側の仕様のようだが. == データの整合性 == === 変数のあるなし === PyAmazon は内部で Amazon API の XML を呼び出して xml.dom.minidom で解析した後,unmarshal という関数で階層構造に沿ってオブジェクトを作っている.そのため,XML の構造がそのまま Python のオブジェクトに継承されている. そのせいか,結果によってあったりなかったりする要素があるので,適切なエラー処理を書く必要がある. {{{ #!python data = amazon.searchByBlended(unicode('のだめ', 'euc-jp').encode('utf-8')) d = data.ProductLine[0].ProductInfo.Details[0] d.ProductDescription # AttributeError を引き起こす可能性が高い getattr(d, 'ProductDescription', None) # こちらの方が安全 }}} === 型の整合性 === たとえば Artists.Artist の中身が list になったり str になったりする.ちゃんと処理してやらないとハマる. {{{ #!python ATTRS = ['Authors', 'Artists', 'Tracks'] data = amazon.searchByKeyword(unicode('のだめ', 'euc-jp').encode('utf-8'), product_line='classical-jp') for attr in ATTRS: print '%s: ' % attr for d in data: authors = getattr(d, attr, None) # if isinstance(authors, amazon.Bag): authors = getattr(authors, attr[:-1], None) # if isinstance(authors, list): # リストの場合 for a in authors: print ' ', a # elif authors is not None: # リストでも None でもない場合は str と仮定 print ' ', authors }}}