musicbrainz.py : » Media-Sound-Audio » Python-Audio-Tools » audiotools-2.14 » audiotools » Python Open Source

1.	3.1.2 Python
2.	Ajax
3.	Aspect Oriented
4.	Blog
5.	Build
6.	Business Application
7.	Chart Report
8.	Content Management Systems
9.	Cryptographic
10.	Database
11.	Development
12.	Editor
13.	Email
14.	ERP
15.	Game 2D 3D
16.	GIS
17.	GUI
18.	IDE
19.	Installer
20.	IRC
21.	Issue Tracker
22.	Language Interface
23.	Log
24.	Math
25.	Media Sound Audio
26.	Mobile
27.	Network
28.	Parser
29.	PDF
30.	Project Management
31.	RSS
32.	Search
33.	Security
34.	Template Engines
35.	Test
36.	UML
37.	USB Serial
38.	Web Frameworks
39.	Web Server
40.	Web Services
41.	Web Unit
42.	Wiki
43.	Windows
44.	XML
Python Open Source » Media Sound Audio » Python Audio Tools
Python Audio Tools » audiotools 2.14 » audiotools » __musicbrainz__.py
#!/usr/bin/python

#Audio Tools, a module and set of tools for manipulating audio data
#Copyright (C) 2007-2010  Brian Langenberger

#This program is free software; you can redistribute it and/or modify
#it under the terms of the GNU General Public License as published by
#the Free Software Foundation; either version 2 of the License, or
#(at your option) any later version.

#This program is distributed in the hope that it will be useful,
#but WITHOUT ANY WARRANTY; without even the implied warranty of
#MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
#GNU General Public License for more details.

#You should have received a copy of the GNU General Public License
#along with this program; if not, write to the Free Software
#Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA  02110-1301  USA

from audiotools import MetaData,AlbumMetaData,MetaDataFileException,__most_numerous__,DummyAudioFile,sys
import urllib
import gettext

gettext.install("audiotools",unicode=True)

def get_xml_nodes(parent,child_tag):
    return [node for node in parent.childNodes
            if (hasattr(node,"tagName") and
                (node.tagName == child_tag))]

def get_xml_text_node(parent, child_tag):
    try:
        return get_xml_nodes(parent,child_tag)[0].childNodes[0].data.strip()
    except IndexError:
        return u''

#parent is an element with childNodes
#child_order is a list of unicode tag name strings
#alters parent's childNodes to match the given order
def reorder_xml_children(parent, child_order):
    if (parent.childNodes is None):
        return

    child_tags = {}
    leftovers = []
    for child in parent.childNodes:
        if (hasattr(child,"tagName")):
            child_tags.setdefault(child.tagName,[]).append(child)
        else:
            leftovers.append(child)

    #remove all the old childen from parent
    for child in parent.childNodes:
        parent.removeChild(child)

    #re-add the childen in child_order
    for tagName in child_order:
        if (tagName in child_tags):
            for child in child_tags[tagName]:
                parent.appendChild(child)
            del(child_tags[tagName])

    #re-add any leftover children tags or non-tags
    for child_tags in child_tags.values():
        for child in child_tags:
            parent.appendChild(child)

    for child in leftovers:
        parent.appendChild(child)


class MBDiscID:
    #tracks is a list of track lengths in CD frames
    #offsets, if present, is a list of track offsets in CD frames
    #length, if present, is the length of the entire disc in CD frames
    #lead_in is the location of the first track on the CD, in frames
    #first_track_number, last_track_number and lead_out_track_offset are ints
    def __init__(self, tracks=[], offsets=None, length=None, lead_in=150,
                 first_track_number = None, last_track_number = None,
                 lead_out_track_offset = None):
        self.tracks = tracks
        self.__offsets__ = offsets
        self.__length__ = length
        self.__lead_in__ = lead_in
        self.first_track_number = first_track_number
        self.last_track_number = last_track_number
        self.lead_out_track_offset = lead_out_track_offset

    @classmethod
    def from_cdda(cls, cdda):
        tracks = list(cdda)

        return cls(
            tracks=[t.length() for t in tracks],
            offsets=[t.offset() for t in tracks],
            length=cdda.length(),
            lead_in=tracks[0].offset(),
            lead_out_track_offset=cdda.last_sector() + 150 + 1)

    def offsets(self):
        if (self.__offsets__ is None):
            offsets = [self.__lead_in__]

            for track in self.tracks[0:-1]:
                offsets.append(track + offsets[-1])

            return offsets
        else:
            return self.__offsets__

    def __repr__(self):
        return "MBDiscID(tracks=%s,offsets=%s,length=%s,lead_in=%s,first_track_number=%s,last_track_number=%s,lead_out_track_offset=%s)" % \
            (repr(self.tracks),
             repr(self.__offsets__),
             repr(self.__length__),
             repr(self.__lead_in__),
             repr(self.first_track_number),
             repr(self.last_track_number),
             repr(self.lead_out_track_offset))

    #returns a MusicBrainz DiscID value as a string
    def __str__(self):
        from hashlib import sha1

        if (self.lead_out_track_offset is None):
            if (self.__length__ is None):
                lead_out_track_offset = sum(self.tracks) + self.__lead_in__
            else:
                lead_out_track_offset = self.__length__ + self.__lead_in__
        else:
            lead_out_track_offset = self.lead_out_track_offset

        if (self.first_track_number is None):
            first_track_number = 1
        else:
            first_track_number = self.first_track_number

        if (self.last_track_number is None):
            last_track_number = len(self.tracks)
        else:
            last_track_number = self.last_track_number

        digest = sha1("%02X%02X%s" % \
                      (first_track_number,
                       last_track_number,
                       "".join(["%08X" % (i) for i in
                                [lead_out_track_offset] +
                                self.offsets() +
                                ([0] * (99 - len(self.offsets())))])))

        return "".join([{'=':'-','+':'.','/':'_'}.get(c,c) for c in
                        digest.digest().encode('base64').rstrip('\n')])

    def toxml(self, output):
        output.write(MusicBrainzReleaseXML.from_files(
                [DummyAudioFile(length,None,i + 1)
                 for (i,length) in enumerate(self.tracks)]).build())

class MusicBrainz:
    def __init__(self, server, port, messenger):
        self.server = server
        self.port = port
        self.connection = None
        self.messenger = messenger

    def connect(self):
        import httplib

        self.connection = httplib.HTTPConnection(self.server,self.port)

    def close(self):
        if (self.connection is not None):
            self.connection.close()

    #disc_id is a MBDiscID object
    #returns a (matches,dom) tuple
    #where matches is an integer
    #and dom is a minidom Document object or None
    def read_data(self, disc_id, output):
        from xml.dom.minidom import parseString
        from xml.parsers.expat import ExpatError

        self.connection.request(
            "GET",
            "%s?%s" % ("/ws/1/release",
                       urllib.urlencode({"type":"xml","discid":str(disc_id)})))

        response = self.connection.getresponse()
        #FIXME - check for errors in the HTTP response

        data = response.read()

        try:
            dom = parseString(data)
            return (len(dom.getElementsByTagName(u'release')),dom)
        except ExpatError:
            return (0,None)


#thrown if MusicBrainzReleaseXML.read() encounters an error
class MBXMLException(MetaDataFileException):
    def __unicode__(self):
        return _(u"Invalid MusicBrainz XML file")

class MusicBrainzReleaseXML:
    TAG_ORDER = {u"release":[u"title",
                             u"text-representation",
                             u"asin",
                             u"artist",
                             u"release-group",
                             u"release-event-list",
                             u"disc-list",
                             u"puid-list",
                             u"track-list",
                             u"relation-list",
                             u"tag-list",
                             u"user-tag-list",
                             u"rating",
                             u"user-rating"],
                 u"artist":[u"name",
                            u"sort-name",
                            u"disambiguation",
                            u"life-span",
                            u"alias-list",
                            u"release-list",
                            u"release-group-list",
                            u"relation-list",
                            u"tag-list",
                            u"user-tag-list",
                            u"rating"],
                 u"track":[u"title",
                           u"duration",
                           u"isrc-list",
                           u"artist",
                           u"release-list",
                           u"puid-list",
                           u"relation-list",
                           u"tag-list",
                           u"user-tag-list",
                           u"rating",
                           u"user-rating"]}

    #dom should be a DOM object such as xml.dom.minidom.Document
    #of a MusicBrainz Release entry
    def __init__(self, dom):
        self.dom = dom

    @classmethod
    def read(cls, filename):
        from xml.dom.minidom import parse
        from xml.parsers.expat import ExpatError

        try:
            return cls(parse(filename))
        except (IOError,ExpatError):
            raise MBXMLException(filename)

    @classmethod
    def read_data(cls, data):
        from xml.dom.minidom import parseString
        from xml.parsers.expat import ExpatError

        try:
            return cls(parseString(data))
        except ExpatError:
            raise MBXMLException("")

    def metadata(self):
        def get_track_metadata(track_node,
                               album_metadata,
                               track_number):
            try:
                #FIXME - not sure if name or sort-name should take precendence
                artist_name = get_xml_text_node(
                    get_xml_nodes(track_node,u'artist')[0],u'name')
            except IndexError:
                artist_name = album_metadata.artist_name

            track_metadata = MetaData(track_name=get_xml_text_node(track_node,
                                                                   u'title'),
                                      artist_name=artist_name,
                                      track_number=track_number)

            track_metadata.merge(album_metadata)
            return track_metadata


        try:
            release = self.dom.getElementsByTagName(u'release')[0]
        except IndexError:
            return AlbumMetaData([])

        album_name = get_xml_text_node(release,u'title')

        try:
            #FIXME - not sure if name or sort-name should take precendence
            artist_name = get_xml_text_node(get_xml_nodes(release,u'artist')[0],
                                            u'name')
        except IndexError:
            artist_name = u''

        try:
            tracks = get_xml_nodes(get_xml_nodes(release,u'track-list')[0],
                                   u'track')
        except IndexError:
            tracks = []

        album_metadata = MetaData(album_name=album_name,
                                  artist_name=artist_name,
                                  track_total=len(tracks))

        try:
            release_events = get_xml_nodes(release,u'release-event-list')[0]
            event = get_xml_nodes(release_events,u'event')[-1]
            album_metadata.year = event.getAttribute('date')[0:4]
            album_metadata.catalog = event.getAttribute('catalog-number')
        except IndexError:
            pass

        return AlbumMetaData([get_track_metadata(track_node=node,
                                                 album_metadata=album_metadata,
                                                 track_number=i + 1)
                              for (i,node) in enumerate(tracks)])

    #audiofiles should be a list of AudioFile-compatible objects
    #from the same album, possibly with valid MetaData
    #returns a MusicBrainzReleaseXML object with populated DOM
    @classmethod
    def from_files(cls, audiofiles):
        from xml.dom.minidom import parseString

        def make_text_node(document,tagname,text):
            node = document.createElement(tagname)
            node.appendChild(document.createTextNode(text))
            return node

        #our base DOM to start with
        dom = parseString('<?xml version="1.0" encoding="UTF-8"?><metadata xmlns="http://musicbrainz.org/ns/mmd-1.0#" xmlns:ext="http://musicbrainz.org/ns/ext-1.0#"></metadata>')

        release = dom.createElement(u'release')

        track_metadata = [t.get_metadata() for t in audiofiles
                          if (t.get_metadata() is not None)]

        #add album title
        release.appendChild(make_text_node(
                dom,u'title',unicode(__most_numerous__(
                        [m.album_name for m in track_metadata]))))

        #add album artist
        if (len(set([m.artist_name for m in track_metadata])) <
            len(track_metadata)):
            artist = dom.createElement(u'artist')
            album_artist = unicode(__most_numerous__(
                    [m.artist_name for m in track_metadata]))
            artist.appendChild(make_text_node(dom,u'name',album_artist))
            release.appendChild(artist)
        else:
            album_artist = u'' #all track artist names differ
            artist = dom.createElement(u'artist')
            artist.appendChild(make_text_node(dom,u'name',album_artist))
            release.appendChild(artist)

        #add release info (catalog number, release date, media, etc.)
        event_list = dom.createElement(u'release-event-list')
        event = dom.createElement(u'event')

        year = unicode(__most_numerous__(
                [m.year for m in track_metadata]))
        if (year != u""):
            event.setAttribute(u'date',year)

        catalog_number = unicode(__most_numerous__(
                [m.catalog for m in track_metadata]))
        if (catalog_number != u""):
            event.setAttribute(u'catalog-number',catalog_number)

        media = unicode(__most_numerous__(
                [m.media for m in track_metadata]))
        if (media != u""):
            event.setAttribute(u'format',media)

        event_list.appendChild(event)
        release.appendChild(event_list)

        #add tracks
        track_list = dom.createElement(u'track-list')

        for track in audiofiles:
            node = dom.createElement(u'track')
            track_metadata = track.get_metadata()
            if (track_metadata is not None):
                node.appendChild(make_text_node(
                        dom,u'title',track_metadata.track_name))
            else:
                node.appendChild(make_text_node(
                        dom,u'title',u''))

            node.appendChild(make_text_node(
                    dom,u'duration',
                    unicode((track.total_frames() * 1000) /
                            track.sample_rate())))

            if (track_metadata is not None):
                #add track artist, if different from album artist
                if (track_metadata.artist_name != album_artist):
                    artist = dom.createElement(u'artist')
                    artist.appendChild(make_text_node(
                            dom,u'name',track_metadata.artist_name))
                    node.appendChild(artist)

            track_list.appendChild(node)

        release.appendChild(track_list)

        release_list = dom.createElement(u'release-list')
        release_list.appendChild(release)
        dom.getElementsByTagName(u'metadata')[0].appendChild(release_list)

        return cls(dom)

    @classmethod
    def from_cuesheet(cls, cuesheet, total_frames, sample_rate, metadata=None):
        if (metadata is None):
            metadata = MetaData()

        return cls.from_files([DummyAudioFile(
                    length = (pcm_frames * 75) / sample_rate,
                    metadata = metadata,
                    track_number = i + 1) for (i,pcm_frames) in enumerate(
                    cuesheet.pcm_lengths(total_frames))])

    def build(self):
        for (tag,order) in MusicBrainzReleaseXML.TAG_ORDER.items():
            for parent in self.dom.getElementsByTagName(tag):
                reorder_xml_children(parent,order)

        return self.dom.toxml(encoding='utf-8')

#takes a Document containing multiple <release> tags
#and a Messenger object to query for output
#returns a modified Document containing only one <release>
def __select_match__(dom, messenger):
    messenger.info(_(u"Please Select the Closest Match:"))
    matches = dom.getElementsByTagName(u'release')
    selected = 0
    while ((selected < 1) or (selected > len(matches))):
        for i in range(len(matches)):
            messenger.info(_(u"%(choice)s) %(name)s") % \
                               {"choice":i + 1,
                                "name":get_xml_text_node(matches[i],u'title')})
        try:
            messenger.partial_info(_(u"Your Selection [1-%s]:") % \
                                       (len(matches)))
            selected = int(sys.stdin.readline().strip())
        except ValueError:
            selected = 0

    for (i,release) in enumerate(dom.getElementsByTagName(u'release')):
        if (i != (selected - 1)):
            release.parentNode.removeChild(release)

    return dom

#takes a Document containing multiple <release> tags
#and a default selection integer
#returns a modified Document containing only one <release>
def __select_default_match__(dom, selection):
    for (i,release) in enumerate(dom.getElementsByTagName(u'release')):
        if (i != selection):
            release.parentNode.removeChild(release)

    return dom

#takes a MBDiscID value and a file handle for output
#and runs the entire MusicBrainz querying sequence
#the file handle is closed at the conclusion of this function
#if at least one match is found
#returns the number of matches
def get_mbxml(disc_id, output, musicbrainz_server, musicbrainz_port,
              messenger,default_selection=None):
    mb = MusicBrainz(musicbrainz_server,musicbrainz_port,messenger)

    mb.connect()
    messenger.info(
        _(u"Sending Disc ID \"%(disc_id)s\" to server \"%(server)s\"") % \
            {"disc_id":str(disc_id).decode('ascii'),
             "server":musicbrainz_server.decode('ascii','replace')})

    (matches,dom) = mb.read_data(disc_id,output)
    mb.close()

    if (matches == 1):
        messenger.info(_(u"1 match found"))
    else:
        messenger.info(_(u"%s matches found") % (matches))

    if (matches > 1):
        if (default_selection is None):
            output.write(__select_match__(
                    dom,messenger).toxml(encoding='utf-8'))
        else:
            output.write(__select_default_match__(
                    dom,default_selection).toxml(encoding='utf-8'))

        output.close()
        messenger.info(_(u"%s written") % (messenger.filename(output.name)))
    elif (matches == 1):
        output.write(dom.toxml(encoding='utf-8'))
        output.close()
        messenger.info(_(u"%s written") % (messenger.filename(output.name)))
    else:
        return matches
www.java2java.com | Contact Us
All other trademarks are property of their respective owners.
__musicbrainz__.py : » Media-Sound-Audio » Python-Audio-Tools » audiotools-2.14 » audiotools » Python Open Source

musicbrainz.py : » Media-Sound-Audio » Python-Audio-Tools » audiotools-2.14 » audiotools » Python Open Source