root / pkpgcounter / trunk / pkpgpdls / pclxl.py @ 3491

Revision 3491, 30.0 kB (checked in by jerome, 15 years ago)

Fix for some strange looking PCLXL files, workaround until I receive the testcase...

  • Property svn:eol-style set to native
  • Property svn:keywords set to Auth Date Id Rev
RevLine 
[3409]1# -*- coding: utf-8 -*-
[191]2#
3# pkpgcounter : a generic Page Description Language parser
4#
[3474]5# (c) 2003-2009 Jerome Alet <alet@librelogiciel.com>
[463]6# This program is free software: you can redistribute it and/or modify
[191]7# it under the terms of the GNU General Public License as published by
[463]8# the Free Software Foundation, either version 3 of the License, or
[191]9# (at your option) any later version.
[3436]10#
[191]11# This program is distributed in the hope that it will be useful,
12# but WITHOUT ANY WARRANTY; without even the implied warranty of
13# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
14# GNU General Public License for more details.
[3436]15#
[191]16# You should have received a copy of the GNU General Public License
[463]17# along with this program.  If not, see <http://www.gnu.org/licenses/>.
[191]18#
19# $Id$
20#
[193]21
[357]22"""This modules implements a page counter for PCLXL (aka PCL6) documents."""
23
[193]24import sys
[202]25import os
[193]26import mmap
27from struct import unpack
28
[235]29import pdlparser
[252]30import pjl
[193]31
[220]32class Parser(pdlparser.PDLParser) :
[193]33    """A parser for PCLXL (aka PCL6) documents."""
[3436]34    totiffcommands = [ 'pcl6 -sDEVICE=pdfwrite -r"%(dpi)i" -dPARANOIDSAFER -dNOPAUSE -dBATCH -dQUIET -sOutputFile=- "%(infname)s" | gs -sDEVICE=tiff24nc -dPARANOIDSAFER -dNOPAUSE -dBATCH -dQUIET -r"%(dpi)i" -sOutputFile="%(outfname)s" -',
[492]35                       'pcl6 -sDEVICE=pswrite -r"%(dpi)i" -dPARANOIDSAFER -dNOPAUSE -dBATCH -dQUIET -sOutputFile=- "%(infname)s" | gs -sDEVICE=tiff24nc -dPARANOIDSAFER -dNOPAUSE -dBATCH -dQUIET -r"%(dpi)i" -sOutputFile="%(outfname)s" -',
[428]36                     ]
[527]37    required = [ "pcl6", "gs" ]
[555]38    format = "PCLXL (aka PCL6)"
[3436]39    mediasizes = {
[193]40                    0 : "Letter",
41                    1 : "Legal",
42                    2 : "A4",
43                    3 : "Executive",
44                    4 : "Ledger",
45                    5 : "A3",
46                    6 : "COM10Envelope",
47                    7 : "MonarchEnvelope",
48                    8 : "C5Envelope",
49                    9 : "DLEnvelope",
50                    10 : "JB4",
51                    11 : "JB5",
52                    12 : "B5Envelope",
[246]53                    12 : "B5",
[193]54                    14 : "JPostcard",
55                    15 : "JDoublePostcard",
56                    16 : "A5",
57                    17 : "A6",
58                    18 : "JB6",
[246]59                    19 : "JIS8K",
60                    20 : "JIS16K",
61                    21 : "JISExec",
62                    96 : "Default",
[3436]63                 }
64
65    mediasources = {
[193]66                     0 : "Default",
67                     1 : "Auto",
68                     2 : "Manual",
69                     3 : "MultiPurpose",
70                     4 : "UpperCassette",
71                     5 : "LowerCassette",
72                     6 : "EnvelopeTray",
73                     7 : "ThirdCassette",
74                   }
[3436]75
76    orientations = {
[193]77                     0 : "Portrait",
78                     1 : "Landscape",
79                     2 : "ReversePortrait",
80                     3 : "ReverseLandscape",
[246]81                     4 : "Default",
[193]82                   }
[3436]83
84    def isValid(self) :
[3409]85        """Returns True if data is HP PCLXL aka PCL6, or Brother's' XL2HB, else False."""
[522]86        if (((self.firstblock[:128].find("\033%-12345X") != -1) and \
87             (self.firstblock.find(" HP-PCL XL;") != -1) and \
88             ((self.firstblock.find("LANGUAGE=PCLXL") != -1) or \
89              (self.firstblock.find("LANGUAGE = PCLXL") != -1)))) \
90             or ((self.firstblock.startswith(chr(0xcd)+chr(0xca)) and (self.firstblock.find(" HP-PCL XL;") != -1))) :
[387]91            return True
[3409]92        elif (self.firstblock[:128].find("\033%-12345X") != -1) \
93            and (self.firstblock.find("BROTHER XL2HB;") != -1) :
94            self.format = "XL2HB"
95            return True
[3436]96        else :
[387]97            return False
[3436]98
[318]99    def beginPage(self, nextpos) :
[193]100        """Indicates the beginning of a new page, and extracts media information."""
[479]101        # self.logdebug("BeginPage at %x" % nextpos)
[193]102        self.pagecount += 1
[3436]103
[193]104        # Default values
105        mediatypelabel = "Plain"
106        mediasourcelabel = "Main"
107        mediasizelabel = "Default"
108        orientationlabel = "Portrait"
[299]109        duplexmode = None
[3436]110
[193]111        # Now go upstream to decode media type, size, source, and orientation
112        # this saves time because we don't need a complete parser !
113        minfile = self.minfile
[318]114        pos = nextpos - 2
[193]115        while pos > 0 : # safety check : don't go back to far !
116            val = ord(minfile[pos])
117            if val in (0x44, 0x48, 0x41) : # if previous endPage or openDataSource or beginSession (first page)
118                break
[3436]119            if val == 0x26 :
[193]120                mediasource = ord(minfile[pos - 2])
121                mediasourcelabel = self.mediasources.get(mediasource, str(mediasource))
[302]122                pos -= 4
[193]123            elif val == 0x25 :
[302]124                while (pos > 0) and (ord(minfile[pos]) != 0xc0) :
125                    # we search the preceding ubyte tag
126                    pos -= 1
127                if pos > 0 :
128                    if ord(minfile[pos-1]) == 0xc8 :
129                        # if we found an ubyte_array then the media
130                        # size is completely spelled
131                        arraylength = ord(minfile[pos+1])
132                        mediasizelabel = minfile[pos+2:pos+2+arraylength].title()
133                        pos -= 1
[3436]134                    else :
[302]135                        # if we just found an ubyte, then the media
136                        # size is known by its index
137                        mediasize = ord(minfile[pos+1])
138                        mediasizelabel = self.mediasizes.get(mediasize, str(mediasize))
[3436]139                    pos -= 1
[310]140                    # self.logdebug("Media size : %s" % mediasizelabel)
[3436]141            elif val == 0x28 :
[193]142                orientation = ord(minfile[pos - 2])
[252]143                orientationlabel = self.orientations.get(orientation, str(orientation))
[302]144                pos -= 4
[3436]145            elif val == 0x27 :
[193]146                savepos = pos
[302]147                pos -= 1
[3436]148                startpos = size = None
[193]149                while pos > 0 : # safety check : don't go back to far !
150                    val = ord(minfile[pos])
[3436]151                    pos -= 1
[193]152                    if val == 0xc8 :
[293]153                        length = self.tags[ord(minfile[pos+2])] # will probably always be a byte or uint16
[3436]154                        if length == 1 :
[293]155                            startpos = pos + 4
156                            size = unpack("B", self.minfile[pos+3:startpos])[0]
[3436]157                        elif length == 2 :
[293]158                            startpos = pos + 5
[316]159                            size = unpack(self.unpackShort, self.minfile[pos+3:startpos])[0]
[3436]160                        elif length == 4 :
[293]161                            startpos = pos + 7
[316]162                            size = unpack(self.unpackLong, self.minfile[pos+3:startpos])[0]
[3436]163                        else :
[301]164                            raise pdlparser.PDLParserError, "Error on size at %s : %s" % (pos+2, length)
[193]165                        break
[3491]166                try :
167                    mediatypelabel = minfile[startpos:startpos+size]
168                except TypeError :
169                    self.logdebug("PCL/XL parser problem at %i" % savepos)
[310]170                # self.logdebug("Media type : %s" % mediatypelabel)
[3436]171            elif val == 0x34 :
[299]172                duplexmode = "Simplex"
[302]173                pos -= 2
[3436]174            elif val in (0x35, 0x36) :
[299]175                duplexmode = "Duplex"
[302]176                pos -= 2
[3436]177            # else : TODO : CUSTOM MEDIA SIZE AND UNIT !
178            else :
[302]179                pos -= 1  # ignored
[3436]180        self.pages[self.pagecount] = { "copies" : 1,
181                                       "orientation" : orientationlabel,
182                                       "mediatype" : mediatypelabel,
[193]183                                       "mediasize" : mediasizelabel,
184                                       "mediasource" : mediasourcelabel,
[299]185                                       "duplex" : duplexmode,
[3436]186                                     }
[193]187        return 0
[3436]188
189    def endPage(self, nextpos) :
[193]190        """Indicates the end of a page."""
[479]191        # self.logdebug("EndPage at %x" % nextpos)
[318]192        pos3 = nextpos - 3
[193]193        minfile = self.minfile
[318]194        if minfile[pos3:nextpos-1] == self.setNumberOfCopies :
[193]195            # The EndPage operator may be preceded by a PageCopies attribute
196            # So set number of copies for current page.
197            # From what I read in PCLXL documentation, the number
198            # of copies is an unsigned 16 bits integer
[258]199            try :
[454]200                nbcopies = unpack(self.unpackShort, minfile[pos3-2:pos3])[0]
[456]201                # self.logdebug("Number of copies : %i" % nbcopies)
[454]202                self.pages[self.pagecount]["copies"] = nbcopies
[3436]203            except KeyError :
[258]204                self.logdebug("It looks like this PCLXL file is corrupted.")
[193]205        return 0
[3436]206
207    def setColorSpace(self, nextpos) :
[205]208        """Changes the color space."""
[318]209        if self.minfile[nextpos-4:nextpos-1] == self.RGBColorSpace : # TODO : doesn't seem to handle all cases !
[479]210            self.iscolor = True
[205]211        return 0
[3436]212
[318]213    def array_Generic(self, nextpos, size) :
[317]214        """Handles all arrays."""
[318]215        pos = nextpos
[317]216        datatype = ord(self.minfile[pos])
[193]217        pos += 1
[317]218        length = self.tags[datatype]
[193]219        if callable(length) :
[316]220            length = length(pos)
[318]221        try :
222            return 1 + length + size * unpack(self.unpackType[length], self.minfile[pos:pos+length])[0]
223        except KeyError :
224            raise pdlparser.PDLParserError, "Error on array size at %x" % nextpos
[3436]225
226    def array_8(self, nextpos) :
[317]227        """Handles byte arrays."""
[318]228        return self.array_Generic(nextpos, 1)
[3436]229
[318]230    def array_16(self, nextpos) :
[424]231        """Handles 16 bits arrays."""
[318]232        return self.array_Generic(nextpos, 2)
[3436]233
[318]234    def array_32(self, nextpos) :
[479]235        """Handles 32 bits arrays and Canon ImageRunner tags."""
236        minfile = self.minfile
237        irtag = minfile[nextpos-1:nextpos+3]
238        if irtag in (self.imagerunnermarker1, self.imagerunnermarker2) :
239            # This is the beginning of a Canon ImageRunner tag
240            # self.logdebug("Canon ImageRunner tag at %x" % (nextpos-1))
241            codop = minfile[nextpos+1:nextpos+3]
242            length = unpack(">H", minfile[nextpos+7:nextpos+9])[0]
243            # self.logdebug("Canon ImageRunner block length=%04x" % length)
244            toskip = 19
245            if irtag != self.imagerunnermarker2 :
246                toskip += length
247            # self.logdebug("Canon ImageRunner skip until %x" % (nextpos+toskip))
[3436]248            return toskip
[479]249        else :
250            # This is a normal PCLXL array
251            return self.array_Generic(nextpos, 4)
[3436]252
[318]253    def embeddedDataSmall(self, nextpos) :
[193]254        """Handle small amounts of data."""
[318]255        return 1 + ord(self.minfile[nextpos])
[3436]256
[318]257    def embeddedData(self, nextpos) :
[193]258        """Handle normal amounts of data."""
[318]259        return 4 + unpack(self.unpackLong, self.minfile[nextpos:nextpos+4])[0]
[3436]260
261    def skipHPPCLXL(self, nextpos) :
[479]262        """Skip the 'HP-PCL XL' statement if needed."""
263        minfile = self.minfile
[3409]264        if nextpos \
265           and ((minfile[nextpos:nextpos+11] == " HP-PCL XL;") \
266             or (minfile[nextpos:nextpos+14] == " BROTHER XLHB;")) :
[479]267            pos = nextpos
268            while minfile[pos] != '\n' :
269                pos += 1
[3436]270            length = (pos - nextpos + 1)
271            # self.logdebug("Skip HP PCLXL statement until %x" % (nextpos + length))
[479]272            return length
[3436]273        else :
[479]274            return 0
[3436]275
[318]276    def littleEndian(self, nextpos) :
[193]277        """Toggles to little endianness."""
[318]278        self.unpackType = { 1 : "B", 2 : "<H", 4 : "<I" }
279        self.unpackShort = self.unpackType[2]
280        self.unpackLong = self.unpackType[4]
[479]281        # self.logdebug("LittleEndian at %x" % (nextpos - 1))
282        return self.skipHPPCLXL(nextpos)
[3436]283
[318]284    def bigEndian(self, nextpos) :
[193]285        """Toggles to big endianness."""
[318]286        self.unpackType = { 1 : "B", 2 : ">H", 4 : ">I" }
287        self.unpackShort = self.unpackType[2]
288        self.unpackLong = self.unpackType[4]
[479]289        # self.logdebug("BigEndian at %x" % (nextpos - 1))
290        return self.skipHPPCLXL(nextpos)
[3436]291
[318]292    def reservedForFutureUse(self, nextpos) :
[245]293        """Outputs something when a reserved byte is encountered."""
[318]294        self.logdebug("Byte at %x is out of the PCLXL Protocol Class 2.0 Specification" % nextpos)
[3436]295        return 0
296
[318]297    def x46_class3(self, nextpos) :
[310]298        """Undocumented tag 0x46 in class 3.0 streams."""
[318]299        pos = nextpos - 3
[309]300        minfile = self.minfile
[318]301        val = ord(minfile[pos])
302        while val == 0xf8 :
303            funcid = ord(minfile[pos+1])
304            try :
305                offset = self.x46_functions[funcid]
[3436]306            except KeyError :
[318]307                self.logdebug("Unexpected subfunction 0x%02x for undocumented tag 0x46 at %x" % (funcid, nextpos))
308                break
[3436]309            else :
[320]310                pos -= offset
311                length = self.tags[ord(self.minfile[pos])]
[318]312                if callable(length) :
[320]313                    length = length(pos+1)
314                if funcid == 0x92 : # we want to skip these blocks
[318]315                    try :
316                        return unpack(self.unpackType[length], self.minfile[pos+1:pos+length+1])[0]
317                    except KeyError :
318                        raise pdlparser.PDLParserError, "Error on size '%s' at %x" % (length, pos+1)
[309]319            val = ord(minfile[pos])
[3436]320        return 0
321
322    def escape(self, nextpos) :
[245]323        """Handles the ESC code."""
[318]324        pos = endpos = nextpos
[314]325        minfile = self.minfile
326        if minfile[pos : pos+8] == r"%-12345X" :
[245]327            endpos = pos + 9
[252]328            endmark = chr(0x0c) + chr(0x00) + chr(0x1b)
[246]329            asciilimit = chr(0x80)
[269]330            quotes = 0
[314]331            while (minfile[endpos] not in endmark) and \
332                   ((minfile[endpos] < asciilimit) or (quotes % 2)) :
333                if minfile[endpos] == '"' :
[269]334                    quotes += 1
[245]335                endpos += 1
[3436]336
337            # Store this in a per page mapping.
[245]338            # NB : First time will be at page 0 (i.e. **before** page 1) !
339            stuff = self.escapedStuff.setdefault(self.pagecount, [])
[314]340            stuff.append(minfile[pos : endpos])
341            self.logdebug("Escaped datas : [%s]" % repr(minfile[pos : endpos]))
[245]342        return endpos - pos
[3436]343
[318]344    def skipKyoceraPrescribe(self, nextpos) :
[312]345        """Skips Kyocera Prescribe commands."""
[318]346        pos = nextpos - 1
[312]347        minfile = self.minfile
348        if minfile[pos:pos+3] == "!R!" :
[318]349            while (pos - nextpos) < 1024 :   # This is a realistic upper bound, to avoid infinite loops
[312]350                if (minfile[pos] == ";") and (minfile[pos-4:pos] == "EXIT") :
[314]351                    pos += 1
352                    prescribe = self.prescribeStuff.setdefault(self.pagecount, [])
[318]353                    prescribe.append(minfile[nextpos-1:pos])
354                    self.logdebug("Prescribe commands : [%s]" % repr(minfile[nextpos-1:pos]))
[417]355                    break
[3436]356                pos += 1
[417]357            return (pos - nextpos)
[312]358        else :
359            return 0
[3436]360
[193]361    def getJobSize(self) :
362        """Counts pages in a PCLXL (PCL6) document.
[3436]363
[193]364           Algorithm by Jerome Alet.
[3436]365
[193]366           The documentation used for this was :
[3436]367
[193]368           HP PCL XL Feature Reference
369           Protocol Class 2.0
[3436]370           http://www.hpdevelopersolutions.com/downloads/64/358/xl_ref20r22.pdf
371
[246]372           Protocol Class 2.1 Supplement
373           xl_ref21.pdf
[3436]374
[246]375           Protocol Class 3.0 Supplement
376           xl_refsup30r089.pdf
[193]377        """
[3436]378
[479]379        infileno = self.infile.fileno()
380        self.minfile = minfile = mmap.mmap(infileno, os.fstat(infileno)[6], prot=mmap.PROT_READ, flags=mmap.MAP_SHARED)
[3436]381
[479]382        self.iscolor = False
[3436]383
[449]384        found = False
[193]385        while not found :
386            line = self.infile.readline()
387            if not line :
388                break
[3409]389            pos = line.find(" HP-PCL XL;")
390            if pos == -1 :
391                pos = line.find(" BROTHER XL2HB;")
[293]392            if pos != -1 :
[449]393                found = True
[293]394                endian = ord(line[pos - 1])
[193]395                if endian == 0x29 :
[316]396                    self.littleEndian(0)
[3436]397                elif endian == 0x28 :
[316]398                    self.bigEndian(0)
[479]399                # elif endian == 0x27 : # TODO : This is the ASCII binding code : what does it do exactly ?
[3436]400                #
401                else :
[200]402                    raise pdlparser.PDLParserError, "Unknown endianness marker 0x%02x at start !" % endian
[193]403        if not found :
[200]404            raise pdlparser.PDLParserError, "This file doesn't seem to be PCLXL (aka PCL6)"
[3436]405
[246]406        # Initialize Media Sources
407        for i in range(8, 256) :
408            self.mediasources[i] = "ExternalTray%03i" % (i - 7)
[3436]409
[193]410        # Initialize table of tags
[3436]411        self.tags = [ 0 ] * 256
412
[245]413        self.tags[0x1b] = self.escape # The escape code
[3436]414
[352]415        self.tags[0x21] = self.skipKyoceraPrescribe # 0x21 is not normally used
[3436]416
[193]417        # GhostScript's sources tell us that HP printers
418        # only accept little endianness, but we can handle both.
419        self.tags[0x28] = self.bigEndian    # BigEndian
420        self.tags[0x29] = self.littleEndian # LittleEndian
[3436]421
[193]422        self.tags[0x43] = self.beginPage    # BeginPage
423        self.tags[0x44] = self.endPage      # EndPage
[245]424        self.tags[0x45] = self.reservedForFutureUse # reserved
[3436]425
426        self.tags[0x46] = self.x46_class3
427
[245]428        self.tags[0x4a] = self.reservedForFutureUse # reserved
429        self.tags[0x4b] = self.reservedForFutureUse # reserved
430        self.tags[0x4c] = self.reservedForFutureUse # reserved
431        self.tags[0x4d] = self.reservedForFutureUse # reserved
432        self.tags[0x4e] = self.reservedForFutureUse # reserved
[3436]433
[245]434        self.tags[0x56] = self.reservedForFutureUse # TODO : documentation not clear about reserved status
[3436]435
[245]436        self.tags[0x57] = self.reservedForFutureUse # reserved
[3436]437
[245]438        self.tags[0x59] = self.reservedForFutureUse # reserved
439        self.tags[0x5a] = self.reservedForFutureUse # reserved
[3436]440
[206]441        self.tags[0x6a] = self.setColorSpace    # to detect color/b&w mode
[3436]442
[245]443        self.tags[0x87] = self.reservedForFutureUse # reserved
444        self.tags[0x88] = self.reservedForFutureUse # reserved
445        self.tags[0x89] = self.reservedForFutureUse # reserved
446        self.tags[0x8a] = self.reservedForFutureUse # reserved
[3436]447
[245]448        self.tags[0x8b] = self.reservedForFutureUse # reserved
[3436]449
[245]450        self.tags[0x8c] = self.reservedForFutureUse # reserved
451        self.tags[0x8d] = self.reservedForFutureUse # reserved
452        self.tags[0x8e] = self.reservedForFutureUse # reserved
453        self.tags[0x8f] = self.reservedForFutureUse # reserved
454        self.tags[0x90] = self.reservedForFutureUse # reserved
[3436]455
[245]456        self.tags[0x9a] = self.reservedForFutureUse # reserved
457        self.tags[0x9c] = self.reservedForFutureUse # reserved
[3436]458
[245]459        self.tags[0xa4] = self.reservedForFutureUse # reserved
460        self.tags[0xa5] = self.reservedForFutureUse # reserved
461        self.tags[0xa6] = self.reservedForFutureUse # reserved
462        self.tags[0xa7] = self.reservedForFutureUse # reserved
[3436]463
[245]464        self.tags[0xaa] = self.reservedForFutureUse # reserved
465        self.tags[0xab] = self.reservedForFutureUse # reserved
466        self.tags[0xac] = self.reservedForFutureUse # reserved
467        self.tags[0xad] = self.reservedForFutureUse # reserved
468        self.tags[0xae] = self.reservedForFutureUse # reserved
469        self.tags[0xaf] = self.reservedForFutureUse # reserved
[3436]470
[245]471        self.tags[0xb7] = self.reservedForFutureUse # reserved
[3436]472
[245]473        self.tags[0xba] = self.reservedForFutureUse # reserved
474        self.tags[0xbb] = self.reservedForFutureUse # reserved
475        self.tags[0xbc] = self.reservedForFutureUse # reserved
476        self.tags[0xbd] = self.reservedForFutureUse # reserved
477        self.tags[0xbe] = self.reservedForFutureUse # reserved
[3436]478
[316]479        # self.tags[0xbf] = self.passThrough # PassThrough mode should already be taken care of automatically
[3436]480
[193]481        self.tags[0xc0] = 1 # ubyte
482        self.tags[0xc1] = 2 # uint16
483        self.tags[0xc2] = 4 # uint32
484        self.tags[0xc3] = 2 # sint16
485        self.tags[0xc4] = 4 # sint32
486        self.tags[0xc5] = 4 # real32
[3436]487
[245]488        self.tags[0xc6] = self.reservedForFutureUse # reserved
489        self.tags[0xc7] = self.reservedForFutureUse # reserved
[3436]490
[193]491        self.tags[0xc8] = self.array_8  # ubyte_array
492        self.tags[0xc9] = self.array_16 # uint16_array
493        self.tags[0xca] = self.array_32 # uint32_array
494        self.tags[0xcb] = self.array_16 # sint16_array
495        self.tags[0xcc] = self.array_32 # sint32_array
[479]496        self.tags[0xcd] = self.array_32 # real32_array and unfortunately Canon ImageRunner
[3436]497
[245]498        self.tags[0xce] = self.reservedForFutureUse # reserved
499        self.tags[0xcf] = self.reservedForFutureUse # reserved
[3436]500
[193]501        self.tags[0xd0] = 2 # ubyte_xy
502        self.tags[0xd1] = 4 # uint16_xy
503        self.tags[0xd2] = 8 # uint32_xy
504        self.tags[0xd3] = 4 # sint16_xy
505        self.tags[0xd4] = 8 # sint32_xy
506        self.tags[0xd5] = 8 # real32_xy
[245]507        self.tags[0xd6] = self.reservedForFutureUse # reserved
508        self.tags[0xd7] = self.reservedForFutureUse # reserved
509        self.tags[0xd8] = self.reservedForFutureUse # reserved
510        self.tags[0xd9] = self.reservedForFutureUse # reserved
511        self.tags[0xda] = self.reservedForFutureUse # reserved
512        self.tags[0xdb] = self.reservedForFutureUse # reserved
513        self.tags[0xdc] = self.reservedForFutureUse # reserved
514        self.tags[0xdd] = self.reservedForFutureUse # reserved
515        self.tags[0xde] = self.reservedForFutureUse # reserved
516        self.tags[0xdf] = self.reservedForFutureUse # reserved
[3436]517
[193]518        self.tags[0xe0] = 4  # ubyte_box
519        self.tags[0xe1] = 8  # uint16_box
520        self.tags[0xe2] = 16 # uint32_box
521        self.tags[0xe3] = 8  # sint16_box
522        self.tags[0xe4] = 16 # sint32_box
523        self.tags[0xe5] = 16 # real32_box
[245]524        self.tags[0xe6] = self.reservedForFutureUse # reserved
525        self.tags[0xe7] = self.reservedForFutureUse # reserved
526        self.tags[0xe8] = self.reservedForFutureUse # reserved
527        self.tags[0xe9] = self.reservedForFutureUse # reserved
528        self.tags[0xea] = self.reservedForFutureUse # reserved
529        self.tags[0xeb] = self.reservedForFutureUse # reserved
530        self.tags[0xec] = self.reservedForFutureUse # reserved
531        self.tags[0xed] = self.reservedForFutureUse # reserved
532        self.tags[0xee] = self.reservedForFutureUse # reserved
533        self.tags[0xef] = self.reservedForFutureUse # reserved
[3436]534
[245]535        self.tags[0xf0] = self.reservedForFutureUse # reserved
536        self.tags[0xf1] = self.reservedForFutureUse # reserved
537        self.tags[0xf2] = self.reservedForFutureUse # reserved
538        self.tags[0xf3] = self.reservedForFutureUse # reserved
539        self.tags[0xf4] = self.reservedForFutureUse # reserved
540        self.tags[0xf5] = self.reservedForFutureUse # reserved
541        self.tags[0xf6] = self.reservedForFutureUse # reserved
542        self.tags[0xf7] = self.reservedForFutureUse # reserved
[3436]543
[193]544        self.tags[0xf8] = 1 # attr_ubyte
545        self.tags[0xf9] = 2 # attr_uint16
[3436]546
[193]547        self.tags[0xfa] = self.embeddedData      # dataLength
548        self.tags[0xfb] = self.embeddedDataSmall # dataLengthByte
[3436]549
[245]550        self.tags[0xfc] = self.reservedForFutureUse # reserved
551        self.tags[0xfd] = self.reservedForFutureUse # reserved
552        self.tags[0xfe] = self.reservedForFutureUse # reserved
553        self.tags[0xff] = self.reservedForFutureUse # reserved
[3436]554
555        # color spaces
[206]556        self.BWColorSpace = "".join([chr(0x00), chr(0xf8), chr(0x03)])
557        self.GrayColorSpace = "".join([chr(0x01), chr(0xf8), chr(0x03)])
558        self.RGBColorSpace = "".join([chr(0x02), chr(0xf8), chr(0x03)])
[3436]559
[206]560        # set number of copies
[3436]561        self.setNumberOfCopies = "".join([chr(0xf8), chr(0x31)])
562
[318]563        # subcodes for undocumented tag 0x46 and the negative
564        # offset to grab the value from.
565        self.x46_functions = { 0x91 : 5,
566                               0x92 : 5,
567                               0x93 : 3,
568                               0x94 : 3,
569                               0x95 : 5,
570                               0x96 : 2,
571                               0x97 : 2,
572                               0x98 : 2,
573                             }
[3436]574
[479]575        # Markers for Canon ImageRunner printers
576        self.imagerunnermarker1 = chr(0xcd) + chr(0xca) + chr(0x10) + chr(0x00)
577        self.imagerunnermarker2 = chr(0xcd) + chr(0xca) + chr(0x10) + chr(0x02)
[3436]578
579        self.pages = { 0 : { "copies" : 1,
580                             "orientation" : "Default",
581                             "mediatype" : "Plain",
582                             "mediasize" : "Default",
583                             "mediasource" : "Default",
[299]584                             "duplex" : None,
[3436]585                           }
586                     }
[193]587        tags = self.tags
588        self.pagecount = 0
[314]589        self.escapedStuff = {}   # For escaped datas, mostly PJL commands
590        self.prescribeStuff = {} # For Kyocera Prescribe commands
[316]591        pos = oldpos = 0
[193]592        try :
[307]593            try :
594                while 1 :
595                    try :
[316]596                        tag = ord(minfile[pos])
[3436]597                    except OverflowError :
[307]598                        pos = oldpos + 1
599                    pos += 1
[316]600                    length = tags[tag]
[307]601                    if length :
[3436]602                        if callable(length) :
[316]603                            length = length(pos)
[3436]604                        oldpos = pos
605                        pos += length
606            except IndexError : # EOF ?
[307]607                pass
608        finally :
609            self.minfile.close()
[3436]610
[193]611        # now handle number of copies for each page (may differ).
[206]612        if self.iscolor :
613            colormode = "Color"
[3436]614        else :
[253]615            colormode = "BW"
[3436]616
[253]617        defaultduplexmode = "Simplex"
618        defaultpapersize = ""
[3436]619        defaultpjlcopies = 1
[252]620        oldpjlcopies = -1
[253]621        oldduplexmode = ""
622        oldpapersize = ""
[193]623        for pnum in range(1, self.pagecount + 1) :
624            # if no number of copies defined, take 1, as explained
625            # in PCLXL documentation.
626            # NB : is number of copies is 0, the page won't be output
[3436]627            # but the formula below is still correct : we want
[193]628            # to decrease the total number of pages in this case.
[299]629            page = self.pages.get(pnum, self.pages.get(1, { "copies" : 1, "mediasize" : "Default", "duplex" : None }))
[266]630            pjlstuff = self.escapedStuff.get(pnum, self.escapedStuff.get(0, []))
[252]631            if pjlstuff :
632                pjlparser = pjl.PJLParser("".join(pjlstuff))
633                nbdefaultcopies = int(pjlparser.default_variables.get("COPIES", -1))
634                nbcopies = int(pjlparser.environment_variables.get("COPIES", -1))
635                nbdefaultqty = int(pjlparser.default_variables.get("QTY", -1))
636                nbqty = int(pjlparser.environment_variables.get("QTY", -1))
637                if nbdefaultcopies > -1 :
638                    defaultpjlcopies = nbdefaultcopies
639                if nbdefaultqty > -1 :
640                    defaultpjlcopies = nbdefaultqty
641                if nbcopies > -1 :
[253]642                    pjlcopies = nbcopies
[252]643                elif nbqty > -1 :
[253]644                    pjlcopies = nbqty
[252]645                else :
[3436]646                    if oldpjlcopies == -1 :
[253]647                        pjlcopies = defaultpjlcopies
[3436]648                    else :
649                        pjlcopies = oldpjlcopies
650                if page["duplex"] :
[299]651                    duplexmode = page["duplex"]
[3436]652                else :
[299]653                    defaultdm = pjlparser.default_variables.get("DUPLEX", "")
654                    if defaultdm :
655                        if defaultdm.upper() == "ON" :
656                            defaultduplexmode = "Duplex"
[3436]657                        else :
[299]658                            defaultduplexmode = "Simplex"
659                    envdm = pjlparser.environment_variables.get("DUPLEX", "")
660                    if envdm :
661                        if envdm.upper() == "ON" :
662                            duplexmode = "Duplex"
[3436]663                        else :
[299]664                            duplexmode = "Simplex"
[3436]665                    else :
[299]666                        if not oldduplexmode :
667                            duplexmode = defaultduplexmode
[3436]668                        else :
[299]669                            duplexmode = oldduplexmode
[253]670                defaultps = pjlparser.default_variables.get("PAPER", "")
671                if defaultps :
672                    defaultpapersize = defaultps
673                envps = pjlparser.environment_variables.get("PAPER", "")
674                if envps :
675                    papersize = envps
[3436]676                else :
[253]677                    if not oldpapersize :
678                        papersize = defaultpapersize
[3436]679                    else :
[253]680                        papersize = oldpapersize
[3436]681            else :
[252]682                if oldpjlcopies == -1 :
683                    pjlcopies = defaultpjlcopies
[3436]684                else :
[252]685                    pjlcopies = oldpjlcopies
[253]686                if not oldduplexmode :
687                    duplexmode = defaultduplexmode
[3436]688                else :
[253]689                    duplexmode = oldduplexmode
[3436]690                if not oldpapersize :
[253]691                    papersize = defaultpapersize
[3436]692                else :
[253]693                    papersize = oldpapersize
694                duplexmode = oldduplexmode
695                papersize = oldpapersize or page["mediasize"]
696            if page["mediasize"] != "Default" :
697                papersize = page["mediasize"]
[3436]698            if not duplexmode :
[253]699                duplexmode = oldduplexmode or defaultduplexmode
[3436]700            oldpjlcopies = pjlcopies
[253]701            oldduplexmode = duplexmode
702            oldpapersize = papersize
[456]703            copies = max(pjlcopies, page["copies"]) # Was : pjlcopies * page["copies"]
[193]704            self.pagecount += (copies - 1)
[3436]705            self.logdebug("%s*%s*%s*%s*%s*%s*%s" % (copies,
706                                                 page["mediatype"],
707                                                 papersize,
708                                                 page["orientation"],
709                                                 page["mediasource"],
710                                                 duplexmode,
[252]711                                                 colormode))
[193]712        return self.pagecount
Note: See TracBrowser for help on using the browser.