ext/ply/example/yply/yparse.py - public/gem5 - Git at Google

 # parser for Unix yacc-based grammars
 #
 # Author: David Beazley (dave@dabeaz.com)
 # Date  : October 2, 2006

 import ylex
 tokens = ylex.tokens

 from ply import *

 tokenlist = []
 preclist  = []

 emit_code = 1

 def p_yacc(p):
     '''yacc : defsection rulesection'''

 def p_defsection(p):
     '''defsection : definitions SECTION
                   | SECTION'''
     p.lexer.lastsection = 1
     print "tokens = ", repr(tokenlist)
     print
     print "precedence = ", repr(preclist)
     print
     print "# -------------- RULES ----------------"
     print

 def p_rulesection(p):
     '''rulesection : rules SECTION'''

     print "# -------------- RULES END ----------------"
     print_code(p[2],0)

 def p_definitions(p):
     '''definitions : definitions definition
                    | definition'''

 def p_definition_literal(p):
     '''definition : LITERAL'''
     print_code(p[1],0)

 def p_definition_start(p):
     '''definition : START ID'''
     print "start = '%s'" % p[2]

 def p_definition_token(p):
     '''definition : toktype opttype idlist optsemi '''
     for i in p[3]:
        if i[0] not in "'\"":
            tokenlist.append(i)
     if p[1] == '%left':
         preclist.append(('left',) + tuple(p[3]))
     elif p[1] == '%right':
         preclist.append(('right',) + tuple(p[3]))
     elif p[1] == '%nonassoc':
         preclist.append(('nonassoc',)+ tuple(p[3]))

 def p_toktype(p):
     '''toktype : TOKEN
                | LEFT
                | RIGHT
                | NONASSOC'''
     p[0] = p[1]

 def p_opttype(p):
     '''opttype : '<' ID '>'
                | empty'''

 def p_idlist(p):
     '''idlist  : idlist optcomma tokenid
                | tokenid'''
     if len(p) == 2:
         p[0] = [p[1]]
     else:
         p[0] = p[1]
         p[1].append(p[3])

 def p_tokenid(p):
     '''tokenid : ID
                | ID NUMBER
                | QLITERAL
                | QLITERAL NUMBER'''
     p[0] = p[1]

 def p_optsemi(p):
     '''optsemi : ';'
                | empty'''

 def p_optcomma(p):
     '''optcomma : ','
                 | empty'''

 def p_definition_type(p):
     '''definition : TYPE '<' ID '>' namelist optsemi'''
     # type declarations are ignored

 def p_namelist(p):
     '''namelist : namelist optcomma ID
                 | ID'''

 def p_definition_union(p):
     '''definition : UNION CODE optsemi'''
     # Union declarations are ignored

 def p_rules(p):
     '''rules   : rules rule
                | rule'''
     if len(p) == 2:
        rule = p[1]
     else:
        rule = p[2]

     # Print out a Python equivalent of this rule

     embedded = [ ]      # Embedded actions (a mess)
     embed_count = 0

     rulename = rule[0]
     rulecount = 1
     for r in rule[1]:
         # r contains one of the rule possibilities
         print "def p_%s_%d(p):" % (rulename,rulecount)
         prod = []
         prodcode = ""
         for i in range(len(r)):
              item = r[i]
              if item[0] == '{':    # A code block
                   if i == len(r) - 1:
                       prodcode = item
                       break
                   else:
                       # an embedded action
                       embed_name = "_embed%d_%s" % (embed_count,rulename)
                       prod.append(embed_name)
                       embedded.append((embed_name,item))
                       embed_count += 1
              else:
                   prod.append(item)
         print "    '''%s : %s'''" % (rulename, " ".join(prod))
         # Emit code
         print_code(prodcode,4)
         print
         rulecount += 1

     for e,code in embedded:
         print "def p_%s(p):" % e
         print "    '''%s : '''" % e
         print_code(code,4)
         print

 def p_rule(p):
    '''rule : ID ':' rulelist ';' '''
    p[0] = (p[1],[p[3]])

 def p_rule2(p):
    '''rule : ID ':' rulelist morerules ';' '''
    p[4].insert(0,p[3])
    p[0] = (p[1],p[4])

 def p_rule_empty(p):
    '''rule : ID ':' ';' '''
    p[0] = (p[1],[[]])

 def p_rule_empty2(p):
    '''rule : ID ':' morerules ';' '''

    p[3].insert(0,[])
    p[0] = (p[1],p[3])

 def p_morerules(p):
    '''morerules : morerules '|' rulelist
                 | '|' rulelist
                 | '|'  '''

    if len(p) == 2:
        p[0] = [[]]
    elif len(p) == 3:
        p[0] = [p[2]]
    else:
        p[0] = p[1]
        p[0].append(p[3])

 #   print "morerules", len(p), p[0]

 def p_rulelist(p):
    '''rulelist : rulelist ruleitem
                | ruleitem'''

    if len(p) == 2:
         p[0] = [p[1]]
    else:
         p[0] = p[1]
         p[1].append(p[2])

 def p_ruleitem(p):
    '''ruleitem : ID
                | QLITERAL
                | CODE
                | PREC'''
    p[0] = p[1]

 def p_empty(p):
     '''empty : '''

 def p_error(p):
     pass

 yacc.yacc(debug=0)

 def print_code(code,indent):
     if not emit_code: return
     codelines = code.splitlines()
     for c in codelines:
          print "%s# %s" % (" "*indent,c)
	# parser for Unix yacc-based grammars
	#
	# Author: David Beazley (dave@dabeaz.com)
	# Date : October 2, 2006

	import ylex
	tokens = ylex.tokens

	from ply import *

	tokenlist = []
	preclist = []

	emit_code = 1

	def p_yacc(p):
	'''yacc : defsection rulesection'''

	def p_defsection(p):
	'''defsection : definitions SECTION
	\| SECTION'''
	p.lexer.lastsection = 1
	print "tokens = ", repr(tokenlist)
	print
	print "precedence = ", repr(preclist)
	print
	print "# -------------- RULES ----------------"
	print

	def p_rulesection(p):
	'''rulesection : rules SECTION'''

	print "# -------------- RULES END ----------------"
	print_code(p[2],0)

	def p_definitions(p):
	'''definitions : definitions definition
	\| definition'''

	def p_definition_literal(p):
	'''definition : LITERAL'''
	print_code(p[1],0)

	def p_definition_start(p):
	'''definition : START ID'''
	print "start = '%s'" % p[2]

	def p_definition_token(p):
	'''definition : toktype opttype idlist optsemi '''
	for i in p[3]:
	if i[0] not in "'\"":
	tokenlist.append(i)
	if p[1] == '%left':
	preclist.append(('left',) + tuple(p[3]))
	elif p[1] == '%right':
	preclist.append(('right',) + tuple(p[3]))
	elif p[1] == '%nonassoc':
	preclist.append(('nonassoc',)+ tuple(p[3]))

	def p_toktype(p):
	'''toktype : TOKEN
	\| LEFT
	\| RIGHT
	\| NONASSOC'''
	p[0] = p[1]

	def p_opttype(p):
	'''opttype : '<' ID '>'
	\| empty'''

	def p_idlist(p):
	'''idlist : idlist optcomma tokenid
	\| tokenid'''
	if len(p) == 2:
	p[0] = [p[1]]
	else:
	p[0] = p[1]
	p[1].append(p[3])

	def p_tokenid(p):
	'''tokenid : ID
	\| ID NUMBER
	\| QLITERAL
	\| QLITERAL NUMBER'''
	p[0] = p[1]

	def p_optsemi(p):
	'''optsemi : ';'
	\| empty'''

	def p_optcomma(p):
	'''optcomma : ','
	\| empty'''

	def p_definition_type(p):
	'''definition : TYPE '<' ID '>' namelist optsemi'''
	# type declarations are ignored

	def p_namelist(p):
	'''namelist : namelist optcomma ID
	\| ID'''

	def p_definition_union(p):
	'''definition : UNION CODE optsemi'''
	# Union declarations are ignored

	def p_rules(p):
	'''rules : rules rule
	\| rule'''
	if len(p) == 2:
	rule = p[1]
	else:
	rule = p[2]

	# Print out a Python equivalent of this rule

	embedded = [ ] # Embedded actions (a mess)
	embed_count = 0

	rulename = rule[0]
	rulecount = 1
	for r in rule[1]:
	# r contains one of the rule possibilities
	print "def p_%s_%d(p):" % (rulename,rulecount)
	prod = []
	prodcode = ""
	for i in range(len(r)):
	item = r[i]
	if item[0] == '{': # A code block
	if i == len(r) - 1:
	prodcode = item
	break
	else:
	# an embedded action
	embed_name = "_embed%d_%s" % (embed_count,rulename)
	prod.append(embed_name)
	embedded.append((embed_name,item))
	embed_count += 1
	else:
	prod.append(item)
	print " '''%s : %s'''" % (rulename, " ".join(prod))
	# Emit code
	print_code(prodcode,4)
	print
	rulecount += 1

	for e,code in embedded:
	print "def p_%s(p):" % e
	print " '''%s : '''" % e
	print_code(code,4)
	print

	def p_rule(p):
	'''rule : ID ':' rulelist ';' '''
	p[0] = (p[1],[p[3]])

	def p_rule2(p):
	'''rule : ID ':' rulelist morerules ';' '''
	p[4].insert(0,p[3])
	p[0] = (p[1],p[4])

	def p_rule_empty(p):
	'''rule : ID ':' ';' '''
	p[0] = (p[1],[[]])

	def p_rule_empty2(p):
	'''rule : ID ':' morerules ';' '''

	p[3].insert(0,[])
	p[0] = (p[1],p[3])

	def p_morerules(p):
	'''morerules : morerules '\|' rulelist
	\| '\|' rulelist
	\| '\|' '''

	if len(p) == 2:
	p[0] = [[]]
	elif len(p) == 3:
	p[0] = [p[2]]
	else:
	p[0] = p[1]
	p[0].append(p[3])

	# print "morerules", len(p), p[0]

	def p_rulelist(p):
	'''rulelist : rulelist ruleitem
	\| ruleitem'''

	if len(p) == 2:
	p[0] = [p[1]]
	else:
	p[0] = p[1]
	p[1].append(p[2])

	def p_ruleitem(p):
	'''ruleitem : ID
	\| QLITERAL
	\| CODE
	\| PREC'''
	p[0] = p[1]

	def p_empty(p):
	'''empty : '''

	def p_error(p):
	pass

	yacc.yacc(debug=0)

	def print_code(code,indent):
	if not emit_code: return
	codelines = code.splitlines()
	for c in codelines:
	print "%s# %s" % (" "*indent,c)